heparus
Goto Top

Netwerkgeschwindigkeit sinkt beim Kopieren im Gigabit-Lan plötzlich auf weniger als 2 Mbit

Hallo zusammen,

bei uns in der Firma habe ich folgende Infrastruktur:

1. Netgear GSM7224R 24 Port Gigabit Layer 2 Managed Switch with Static Routing Firmware V7
2. Netgear GS748T 48 Port Gigabit mit Firmware V.3
3. Netgear GS748T 48 Port Gigabit mit Firmware V.2 (angeblich lässt sich diese ältere Version, nicht auf Firmware Version 3 updaten)

Die Patchfeld-Verkabelung ist durch die Bank Cat. 5e sämtliche Server sind am GSM7224R angeschlossen. Der ältere GS748T ist mit 2 Kabeln über eine statische LAG (Link Aggregation Group), der neuere GS748T ist mit 2 Kabeln über eine dynamische LAG angebunden (beide Lags verwenden Kupfer). Unser Datenbankserver und unser Fileserver sind jeweils über eine dynamische LAG ebenfalls am GSM7224R angeschlossen.

Wir haben nun folgendes Problem, wenn wir vom oder auf den Fileserver größere Dateien - z.B. ein 50GB Datenbankdatei - kopieren wollen startet der Kopiervorgang bei 50% der Netzwerkgeschwindigkeit und fällt dann nach ca. 2-3 Minuten auf 0,2% der Geschwindigkeit. Dieses Problem passiert sowohl zur Hauptarbeitszeit aber auch mitten in der Nacht, wenn nur ich armer Tropf noch am Testen bin. Zur Zeit bemerken unsere normalen Mitarbeiter diese Schwankungen im Netzwerk noch nicht, da das Problem nur bei größeren Dateien auffällt. Auch größere Datenbankabfragen - wie z.B. für die automatische Briefgenerierung - dauern jetzt länger.

Ich habe zur Zeit per Port Mirroring einen Wireshark am GSM7224R mitlaufen und hoffe, dass dieser ein paar Probleme aufzeigt, aber bis jetzt ist mir noch nichts aufgefallen.

Was ist noch zusagen? Flow-Control ist auf den Switchen aktiviert, ebenso bei den Servern, die MTU ist klassich bei 1500 d.h. Jumboframes verwenden wir nicht. SPT und andere Protokolle, welche auf den Switchen vorhanden sind, sind deaktiviert. Auch ein QoS ist zur Zeit nicht aktiv, das ändert sich aber in den nächsten Wochen wegen VoIP.

Ich hoffe jemand hat eine Idee, was es sein könnte, da mich das Problem echt die Haare raufen lässt.

Mit freundlichen Grüssen

Elmar

Content-Key: 145543

Url: https://administrator.de/contentid/145543

Ausgedruckt am: 28.03.2024 um 12:03 Uhr

Mitglied: sniffnase
sniffnase 24.06.2010 um 12:19:14 Uhr
Goto Top
sind es physische oder virtuelle server?
wenn virtuell hilft es meistens der CPU eine Fixe geschwindigkeit zuzuordnen (zb 2GHz). Standardmäßig ist das ja variabel.
Was für Platten sind im File/ DBServer - sind raids konfiguriert?
wie sind die switches miteinander verbunden (switchingloop) - aber du sagst alle server sind am GSM7224R angeschlossen, somit sind die anderen beiden switches ja wurscht face-smile

was passiert wenn du von einem laptop am einen ende des netzwerks zu einem laptop am anderen ende kopierst, verhält es sich dann genauso?
Mitglied: Bright
Bright 24.06.2010 um 12:27:09 Uhr
Goto Top
Hallo Elmar,

hast du mal gecheckt ob es nicht an den Platten am Server liegt?
hatte das schonmal mit schlechten Raid-Controllern
bei dem fehler damals sind schlicht die Controller in die Knie gegangen

Kannst du mal so eine große Datei auf dem Server kopieren und checken was die performance macht?

gruß
bright
Mitglied: heparus
heparus 24.06.2010 um 16:46:49 Uhr
Goto Top
Es handelt sich um physische Server. Das Thema Virtualisierung steht bei uns noch nicht zur Debatte. Sämtliche Server sind mit min. Raid 10 bzw. Raid 5 beim Fileserver eingerichtet.
Mitglied: heparus
heparus 24.06.2010 um 16:55:25 Uhr
Goto Top
An ein Problem mit dem Raid bzw. den Platten habe ich auch schon gedacht, schließe es aber zur Zeit noch aus. Werde es aber heute aber auch noch per Benchmark prüfen.

Ich vermute ein Netzwerkproblem, da mein eigener PC nicht mehr vom neueren GS748T aus auf unsere Watchguard per https zugreifen kann, welche am GSM7224R angeschlossen ist. Sobald ich es von einem unserer Server versuche geht es sofort.
Mitglied: dog
dog 24.06.2010 um 17:05:55 Uhr
Goto Top
Ich würde mal wild raten und sagen nach 2-3 Minuten ist bei irgendeinem Gerät die Paket-Queue so überlastet, dass es anfängt Pakete zu droppen, was auch immer die gesamte Verbindung verlangsamt.
Mitglied: aqui
aqui 25.06.2010 um 18:13:18 Uhr
Goto Top
deshalb mal Flow Control abschalten, das löst ggf. das Problem. Allerdings darf man von NetGear Geraffel auch keine Wunderperformance erwarten. Bei kleinen Paketen wie sie bei Windows CIFS Kopierereien die Regel sind legen die sich oft die Karten.
Daraus resultiert dann der Unterschied zwischen NetGear und Herstellern mit leistungsfähigerer Hardware. Denn wenn NetGears Switchports auf GiG negotiaten sagt das noch lange nix über des Packet Forwarding Performance aus....das böse Erwachen kommt dann später.... Beim Kopieren z.B.
Versuchs aber mal ohne Flow Control !
Mitglied: heparus
heparus 25.06.2010 um 20:58:51 Uhr
Goto Top
@aqui: Mir wäre ein großer ProCurve auch lieber als die Netgear Switche, aber die wurden leider vor meiner Zeit gekauft und die GF hat nicht nur eine Bärenfalle um das Budget-Konto. Mein Vorgänger hatte irgendwie das Talent aus einem Haufen Schrauben und Blechen eine "funktionierende" Lösung zubauen und an solch geringen Ausgaben hat man sich gewöhnt. Mir wäre auch lieber, wenn ich auf Substorages, Blades, ESX, etc. zurückgreifen könnte und nicht nur auf aufgemotzt PC-Hardware, welche noch treu ihren Dienst tut aber längst nicht mehr ausreichend ist.

Aber mit/ohne FlowControl werde ich mal am Montag testen, ob es eine Verbesserung bringt.


An alle erstmals danke für eure Anregungen.
Mitglied: heparus
heparus 01.07.2010 um 14:40:38 Uhr
Goto Top
Hab das Problem gefunden, uns scheint durch eine Überspannung ein Switch beschädigt worden zu sein. Deswegen hat dieser ständig seine Ports für einen Bruchteil der Sekunde zurück gesetzt und seine Log nicht geschrieben.