x-ray-jin
Goto Top

Fehler-Package Loss beim Kopieren-Schreiben großer Anzahl von Bildern übers Netzwerk

Hi,
ich arbeite für eine Firma die 3d Modellierung und Animation macht. Wir haben hier 2 Netgear Switche GS724T stehen, die miteinander per Linkaggregation verbunden sind. An dem einen Switch hängen die Arbeits-PCs und ein Synology DS1511+ NAS mit 3x3TB Hitachi HDS723030ALA640 und 2x3TB Hitachi HUA723030ALA640 Festplatten(ebenfalls per Linkaggregation verbunden). An dem anderen hängen mehrere PCs als reine Render-PCs.

Das Problem ist nun das nach einem Renderjob, der eine Bildersequenz erstellt, teilweise Bilder kaputt sind also zwar teilweise etwas zu sehen ist aber stellenweise Pixel fehlen. So eine Sequenz besteht gut und gerne aus mehreren 100 Bildern. Die Renderfarm rendert jedes Bild einzeln und schreibt es danach direkt über das Netzwerk auf das NAS. Auf einem Render-PC wird das fertige Bild aber zunächst richtig angezeigt. Erst wenn die Bilder dann gespeichert und vom NAS aus geöffnet werden sind einige fehlerhaft.

Außerdem tritt das Problem scheinbar auch auf wenn die Render-PCs die Bilder erst lokal speichern und man sie dann manuell auf das NAS kopiert. Bleiben die Bilder auf dem RenderPC ist alles in Ordnung.

Laut den Monitoring-Werten der Switche gab es aber keine bis nur sehr wenige fehlerhafte Pakete. Auf jeden Fall zu wenige um die Menge an Fehlern zu rechtfertigen.

Meine Frage ist nun ob jemand eine Idee hat woran es liegen könnte oder wie ich am besten überprüfen kann ob es überhaupt an dem Netzwerk liegt oder die Fehlerquelle doch eher woanders zu suchen ist.

Das NAS meldet für die Festplatten keine Fehler und auch der S.M.A.R.T Status ist Normal.


Vielen Dank
X-Ray-Jin

Content-Key: 207215

Url: https://administrator.de/contentid/207215

Printed on: April 20, 2024 at 05:04 o'clock

Member: Lochkartenstanzer
Lochkartenstanzer May 29, 2013 updated at 12:43:31 (UTC)
Goto Top
Moin,

Wenn Ihr die Dateien üebr smb/cifs ablegt, sollten pakcet-losses keien Auswirkugn haben, weil TCP dafür sorgt, daß die daten ordentlich üebrtragen werden.

Wahrscheinlicher ist es, daß z.B. der Speicher des NAS oder der renderrechne ggf kaputt ist (Bitfehler) und die Fehler daher kommen. Deswegen sollte man in NAS, Server und Workstation eigentlich prinzipiell immer ECC-RAM verwenden.

lks
Member: X-Ray-Jin
X-Ray-Jin May 29, 2013 at 15:13:39 (UTC)
Goto Top
Danke für deine Antwort. RAM-Tests auf den Workstations waren bisher alle fehlerfrei. Den NAS Ram kann ich leider auf die schnelle nicht testen, da er natürlich benötigt wird und ich keinen Ersatzram habe bzw. nicht weiß wie ich ihn direkt im NAS testen kann. Vielleicht dazu eine Anmerkung?

Könnte es auch sein, dass es daran liegt das 2 unterschiedliche Platten im Raid sind? Soweit ich weiß sollte das eigentlich nicht der Fall sein.

Aber das Problem soll angeblich auftreten seit wir das NAS mit ursprünglich 3x hds723030ala640 um 2x hua723030ala640 erweitert haben.

Nun ist die hds laut Hersteller keine für den Dauerbetrieb geeignete Platte sondern eher für den Desktopbereich und die hua Version für den Serverbereich gedacht. Aber das wäre ja dann wieder komisch da ja zuerst die ungeeigneten Platten drinne waren und es problemlos lief...wohlgemerkt "angeblich"...genau lässt sich das Auftreten des Fehlers nicht mehr zeitlich einordnen.