rekrut
Goto Top

Netzwerkverbindung von Server für 1 Minute unterbrochen

Hallo zusammen, habe folgendes Problem:

Seit 2 Tagen unterbricht es mir auf allen Servern die Netzwerkverbindung für ca. eine Minute. Sie wird dann automatisch wieder hergestellt, allerdings unterbricht es mir dann dienste wie das Backup und gewisse Finanzprogramme.

Der Fehler tritt gegen Abend und am frühen Morgen auf, jedoch nie(bis jetzt) in den Bürozeiten!

Habe auf den Servern schon nach Viren oder ähnlichem gesucht (Hijackthis), war alles negativ.

Hier einmal der Event, welcher auf dem Domänencontroller ausgegeben wird:


Event Type: Warning
Event Source: b57w2k
Event Category: None
Event ID: 4
Date: 06.09.2007
Time: 07:03:02
User: N/A
Computer: SRVSBS
Description:
Broadcom NetXtreme Gigabit Ethernet: The network link is down. Check to make sure the network cable is properly connected.

Danach:

Event Type: Information
Event Source: b57w2k
Event Category: None
Event ID: 9
Date: 06.09.2007
Time: 07:04:02
User: N/A
Computer: SRVSBS
Description:
Broadcom NetXtreme Gigabit Ethernet: Network controller configured for 100Mb full-duplex link.


Das Problem besteht, seit auf den Servern neue Sicherheitspatches installiert wurden am Samstag und diese automatisch einen Neustart gemacht haben.

Könnte es damit zusammenhängen? Oder kann etwas anderes im Netzwerk so ein verhalten auslösen?

Bin ratlos und um jeden Rat dankbar!


Falls Ihr noch mehr Informationen braucht lasst es mich wissen, wollte nicht gleich das ganze Netzwerk mit allen Komponenten hier eintragen face-smile


Gruss

rekrut

Content-Key: 68047

Url: https://administrator.de/contentid/68047

Printed on: April 16, 2024 at 05:04 o'clock

Member: Natureshadow
Natureshadow Sep 06, 2007 at 11:03:16 (UTC)
Goto Top
Hallo,

wie geht es denn gerätemäßig nach dem Server weiter? Aktive Switches, die evtl. aus irgendwelchen Gründen rebooten?

Grüße,
Nik
Member: aqui
aqui Sep 06, 2007 at 14:21:15 (UTC)
Goto Top
Hast du Spanning Tree im Netzwerk (Redundanz) ???
Hast du mal einen anderen physischen Switchport für den Server getestet ???

Deine Aussagen in Bezug auf die Netzwerktopologie sind sehr oberflächlich bis gar nicht vorhanden so das man nur raten kann. Scheinbar gehst du ja nur davon aus das dein Server der Buhmann ist und nicht die Switchinfrastruktur.... ?!
Member: rekrut
rekrut Sep 07, 2007 at 07:15:04 (UTC)
Goto Top
Hallo, konnte mich gestern leider nicht mehr melden.

Also folgendes:

Die Server sind direkt mit unserem 100 Mbit Netzwerk verbunden.

Zusätzlich haben wir noch

1 Gbit Switch(ProCurve Switch 2824) für unsere CAD Abteilung(Hat ein eigenes kleines Gbit Netzwerk), dieser Meldet immer um diese Uhrzeiten (17:20, 22:00, 7:03), dass "Excessive Broadcasts" aus unserem Hauptnetzwerk kommen.

Auf diesem ist "Spanning Tree" aktiviert.


1 Gbit Switch(Lynksis SRW2016), welcher über Glasfaser mit unserer Produktion (100 meter entfernt) verbunden ist.

Auf diesem ist "Spanning Tree" ebenfalls aktiv. Mode: "Classic STP"


Auch gestern und heute Morgen sind um die gleiche Uhrzeit wie zuvor die Netzwerkverbindungen unterbrochen worden! Mich wundert es sehr, dass diese Unterbrüche immer zur gleichen Zeit auftreten (+- 1-2 Minuten).

Zudem nur immer ausserhalb der Arbeitszeiten, also zwischen 8 und 17 uhr gibt es nie einen Unterbruch ....


Edit: Hab noch was sehr wichtiges vergessen:

Am Montag morgen hatten wir einen Stromunterbruch für 10 Minuten, am Montag Abgend ist das Problem dann das erste mal aufgetreten, könnte ja auch sehr gut was damit zu tun haben!
Member: aqui
aqui Sep 07, 2007 at 18:27:29 (UTC)
Goto Top
Oha....exzessive Broadcasts hört sich nicht gut an und dann auch noch mit Gigabit und solche leistungsschwachen Consumer Switches.... keine wirklich gute HW Wahl für CAD Netze oder Segmente mit hohem Durchsatz. Ggf solltest du mal darüber nachdenken dein netzwerk mit VLANs zu segmentieren, das mindert die Gefahr solcher Broadcast Stürme drastisch bzw. unterdrückt sie komplett..., aber versuchen wir mal das Problem einzugrenzen..

Hast du mit einem Wireshark Sniffer (www.wireshark.org) dir mal angesehen woher diese excessive Broadcasts kommen ??? Da gibt es einen oder mehrere Verursacher und die bzw. die IP oder Mac Adressen muss man erstmal isolieren und das Broadcast Problem fixen...das wird das Hauptübel sein.

Das Problem ist das diese, mit Verlaub, Billigswitches sehr schwachbrüstige CPUs haben. Broadcasts und Multicasts muss aber die CPU kopieren und auf alle Ports forwarden per Definition. Das belastet diese Maschinen meist sehr stark.
Interessant wäre mal hier per SNMP (vermutlich sind ja beide Switches managebar) die CPU Last mit einem Tool wie dem SNMPRG (http://snmprg.sourceforge.net/) zu monitoren. Die nötige OID sollte dir das Handbuch sagen oder ein SNMP Walk zeigen...
Wenn deren Switch CPU überlastet ist durch solche Broadcasts schickt die oft Ports in den STP Blocking Modus und andere böse Dinge die du scheinbar siehst...
Dazu solltest du mal das Switchlog befragen. Jedenfalls bei HP geht das mit show log auf dem CLI Interface.
So oder so musst du erstmal die Ursache für diese Broadcast Stürme herausfinden !
Member: rekrut
rekrut Sep 10, 2007 at 07:49:29 (UTC)
Goto Top
Tja bin auch erst seit 3 Monaten in der Firma, und die CAD Leute beschweren sich eh die ganze Zeit dass Ihr Netz nicht schnell genug ist, aber das is dann wieder ein anderes Thema ...

Habe den Fehler nun eingrenzen können:

Folgender Switch (Stockwerverteiler) bootet immer um die gleiche Uhrzeit neu:

HP J4121A ProCurve Switch 4000M

Werde heute Abend mal den Switch vom USV abhängen, neu starten und dann direkt an den Strom hängen, hoffe das ich damit erfolg haben werde!

Oder habt Ihr noch andere Lösungsansätze?


Gruss

rekrut
Member: aqui
aqui Sep 11, 2007 at 09:08:24 (UTC)
Goto Top
Ja, ggf. ein neues Firmware Image auf diesen problematischen Switch aufspielen:

http://www.hp.com/rnd/software/j4110928.htm

Langfristig wirst du da nur Ordnung und Ruhe mit einem Redesign des netzes reinbringen. Die CAD Abteilung in einem flachen dummen Layer 2 Design zu betreiben ist Unsinn. Du solltest das mit VLANs segementieren, mindestens die CAD Abteilung und diese mit einem Layer 3 Switch vom Restnetz trennen, das die ein eigenes Gigabit Segment haben. Ggf. für andere Abteilungen des Netzes auch. Das wird dir auf Dauer alle Probleme lösen.
Member: rekrut
rekrut Sep 11, 2007 at 11:12:55 (UTC)
Goto Top
Konnte das Problem jetzt lösen, indem ich den Switch vom USV abgehängt habe.

Werde ebenfalls noch die Firmware aktualisieren.

Das mit dem VLAN sieht interessant aus, muss mich aber zuerst einmal in die Materie einarbeiten. Kenne mich da noch nicht aus.

Danke an alle, die geholfen haben das Problem zu lösen.


Gruss

rekrut
Member: aqui
aqui Sep 11, 2007 at 14:43:21 (UTC)
Goto Top
Hier findest du eine gute Lektuere dazu:

http://www.heise.de/netze/artikel/77832