condor83
Goto Top

Netzwerkausfall

Hallo

Hab da ein Problem und bräuchte vorschläge wie ich noch nach einer lösung suchen könnte.

Ich betreue ua ein schulnetzwerk mit ca 200 PCs und notebooks und einen Hauptserver 2003 der auch die adressen vergiebt und 7 klassenserver 2003.

das problem ist dass das netzwerk sporadisch (manchmal 5 mal am tag, manchmal gar nicht) ausfällt. dann kann kein pc den anderen oder einen server erreichen (nicht mal anpingen). durch aus und eischalten der switches kan das problem gelöst werden und danach läuft das gesammte netzwerk uu. für tage wieder einwandfrei. es müssen aber nicht alle switches dafür neu gestartet werden, aber immer andere.

habe alle server upgedatet und auch schon einige switches testweise durch einen neuen ersetzt - ohne erfolg

was könnte der grund für solche ausfälle sein? währe für jede anregung dankbar um die fehlersuche einzugrenzen.

danke im voraus...

Content-Key: 82673

Url: https://administrator.de/contentid/82673

Printed on: April 26, 2024 at 22:04 o'clock

Member: Yoshi-GP
Yoshi-GP Mar 10, 2008 at 06:40:43 (UTC)
Goto Top
Morgen.

Naja, die Infos sind etwas spährlich. Was hast Du seither gemacht/geprüft?

Behalten die Clients Ihre IP-Adressen, wenn das Problem auftritt bzw. können Sie diese neu beziehen? Oder wird die Verbindung physikalisch getrennt (keine Netzwerkverbindung mehr vorhanden)?

Hast Du die Konfiguration der Switche mal gepüft? Wie sieht es da mit der Firmware aus?

Und, wichtige Frage, seit wann tritt es auf und gibt es Änderungen, die kurz vor Auftreten des Problemes durchgeführt wurden? Ich vermute hier die Ursache weniger in den Servern denn in den Switchen bzw. Netzwerkseitig.

Was sagen die die Eventlogs auf den Maschinen und auf den Servern?

Auf was hast Du die PINGs gesendet? Name oder IP? Wenn Ping auf Name nicht funktioniert, Ping auf IP aber doch, wäre die Ursache im DNS zu suchen.
Member: Franku
Franku Mar 10, 2008 at 07:54:37 (UTC)
Goto Top
Könnten auch einfach Störimpulse in der Verkabelung durch Netzbeeinflussung (Stromnetz), defektes Schaltnetzteil etc. vorliegen. Überprüfung aufwändig (Fachfirma mit entsprechenden Messgeräten). Ist vor dem Auftreten irgend was elektrisches im Gebäude geändert worden?
Gruß
Frank
Member: condor83
condor83 Mar 10, 2008 at 15:21:00 (UTC)
Goto Top
Hallo - danke für die ersten meldungen...

Die clients behalten ihre adressen - können aber keine neuen beziehen. Die kontrollleuchten für netzwerkverbindung an den LAN-karten und switches leuchten aber es besteht eben keine verbindung - ping über name und ip-adresse nicht möglich.

wegen der änderungen davor - direkt davor gab es keine änderungen (das problem besteht schon seit herbst) aber kurz davor worde das netzwerk um 3 klassenserver und 80 notebooks erweitert. ich vermute schon auch dass es damit etwas zu tun hat, aber was?

Die Eventlogs melden garnichts bezüglich der netzwerkausfälle - einfach nur netzwerk weg und wenn man die switches neustartet - netzwerk wieder da...

interresant ist das sporadische auftreten - meis am nachmittag - manchmal kommt der fehler 10 minuten nach dem switchneustart wieder, dann wieder ein paar tage nichts - und auch nicht über das wochenende... daher halte ich auch die störimpulse für möglich...

lg
Member: aqui
aqui Mar 10, 2008 at 15:24:21 (UTC)
Goto Top
Vermutlich sind das Billigswitches und du fährst kein Spanning Tree.
Nach deinen in der Tat sehr rudimentären Schilderungen (kein Netzdesign, VLANs ja oder nein, Verschaltung der Switches) kann man dir auch nur sehr oberflächlich helfen.
Vermutlich looped (Layer 2 Loop) dein Netz durch Nichtverwendung von Spanning Tree oder Fehlkonfiguriation einiger Endkomponenten.
Der Loop bedeutet dann 99% Auslastung auf den Switches und dann ist klar das nichts mehr funktioniert.

Ohne detailiertere Infos ist eine sinnvolle Hilfestellung nicht möglich wenn das nicht in Raten oder Wahrsagen ausarten soll... face-sad
Member: Yoshi-GP
Yoshi-GP Mar 10, 2008 at 16:48:29 (UTC)
Goto Top
Ja, da hat aqui absolut recht.

Check mal zuerst die Firmware der Switche und lass uns die Typenbezeichnungen wissen.

Eine kleine Beschreibung (gern Visio und dann als PDF oder JPG) über die Netzstruktur wäre auch ganz gut.

Und Vorsicht mit SpanningTree, daß kann auch nach hinten losgehen.

Nehmen wir als Beispiel zwei Gebäudehälften, welche über 1xKupfer oder 1xLWL verbunden sind. Wenn dann auf beiden Seiten eventuell gestackte Switches vorhanden sind, kann die SpanningTree das ganze LAN zum Kippen bringen, weil keine Redundanz vorhanden ist.

Aqui hat mit evtl. 99% Last recht, daß kann gut sein; aber bitte nicht einfach SpanningTree im Switch aktivieren, ohne daß die Voraussetzungen dafür da sind.

Gruss Jan
Member: aqui
aqui Mar 10, 2008 at 17:11:44 (UTC)
Goto Top
@bluecolors
Spanning Tree bringt es ja gerade nicht zum Kippen, aber das würde jetzt einen größeren Exkurs über STP hier nach sich ziehen, da man nicht genau weiss WAS und WIE du mit dem Kupfer und LWL Link vorhast....
Member: Yoshi-GP
Yoshi-GP Mar 10, 2008 at 17:19:48 (UTC)
Goto Top
Du hast recht, wie ich schon sagte! face-smile

Aber STP setzt redundante Leitungen voraus. Wenn die nicht da sind, steigert STP die Last und die Latenzzeiten.

Aber es ist natürlich immer abhängig von der Netzwerkarchitektur.

Ich wollte nur vorbeugen, daß nicht blauäugig STP aktiviert wird und es keine Verbesserung sondern eher eine Verschlechterung bewirkt, weil das Netzwerk nicht entsprechend aufgebaut ist.

Schauen wir erstmal, was condor83 sagt. Ihm wollen wir ja erstmal helfen, und dafür benötigen wir INFOS.

Gruss Jan
Member: aqui
aqui Mar 10, 2008 at 17:38:40 (UTC)
Goto Top
@bluecolors
Oha...nun bewegst du dich aber auf sehr dünnem Eis. Zwei Dinge zur sachlichen Korrektur da man die o.a. Statements technisch so nicht ganz stehenlassen kann:

STP setzt natürlich niemals per se ein redundantes Netz voraus, das ist Unsinn ! Es funktioniert natürlich auch ohne Leitungs Redundanz, da nur Packete gesendet werden, ist aber dann ohne redundante Links gewissermaßen funktionell sinnlos.
Es beugt aber immer der latenten Gefahr vor das bei einer Fehlkonfiguration oder falschem Stecken von Kabeln das Netz kollabiert und sorgt so dafür das niemals ein Loop entstehen kann !
Ein Grund warum alle Premium Hersteller von Switches grundsätzlich auf ihren Layer 2 Switches STP per Default immer eingeschaltet haben !
Aktiviertes STP bewirkt folglich niemals eine Verschlechterung der Performance weder in redundanten noch in nicht redundanten Netzen !!!

STP steigert nur minimal die Last. STP BPDU Packete kommen alle 3 Sekunden mit 64 Byte Länge. Minipackete die also in heutigen Strukturen mit GiG Backbones absolut irrelevant sind und niemals ins Gewicht in puncto Performance fallen. Der Sicherheitsaspekt von STP ist da erheblich höher zu bewerten !!
Die Latenzzeit eines Switches ist niemals von externen Protokollen und/oder Features wie Z.B. STP bestimmt, sondern immer durch die verwendete Hardware eine Switches. Auf die Latenz hat also STP niemals einen Einfluss das ist technisch nicht möglich !!!

Ok, dann sind wir mal gespannt was der condor83 dann noch so für Infos für uns hat...
Member: Yoshi-GP
Yoshi-GP Mar 10, 2008 at 18:04:46 (UTC)
Goto Top
Auch da hat Aqui wieder recht.
STP setzt die Redundanz nicht zwingend voraus. Macht aber damit eigentlich nur Sinn, da über die Redundanz auch verschiedene Pfade durch STP ermittelt werden können, wovon der schnellste Pfad zu einem Ziel dann auch gewählt wird.

Nehmen wir aber jetzt als Beispiel zwei Gebäudeteile (oder mehr), welche per LWL oder Kupfer (von mir aus GB) verbunden sind. In jedem Gebäude ist ein "Haupt"-Switch untergebracht. Nun ergibt sich daraus ein Backbone, an dessen beiden Seiten nun wiederum weitere Switche gestackt sind. In ungünstigen Konstellationen und willkürlich aktiviertem STP kann es dazu kommen, daß die Ermittlung des schnellsten Pfades einen deutlichen Zeitaufwand darstellt. Dieser Zeitaufwand kann zu Verzögerungen im Netzwerk (und Latenz heisst nichts anderes als Verzögerung) führen. Dies tritt aber meist nur bei Änderungen im Netzwerk auf bzw. in der Lernphase.

Aber, Aqui, ich gebe Dir natürlich in Deinen Ausführungen recht.

Ich kann hier nur aus recht kurzen Erfahrungen sprechen, wobei ich denke, daß Du als Senior-Admin doch schon einiges auf dem Buckel hast. face-smile

Grüße Jan

P.S. Ach ja, condor, wir widmen uns Dir umgehend, sobald ein paar Infos mehr da sind. face-wink
Member: aqui
aqui Mar 10, 2008 at 18:57:33 (UTC)
Goto Top
@bluecolors
Du meinst ein redundantes Netzwerk wie dieses hier als Beispiel, richtig ?!?:

e2b75ce5cbdc8294c56f44c74324ad0d-switchnetz

Nebenbei bemerkt ist dies ein Design wie man Netzwerke solcher Größenordnung wie condor83 es beschreibt auch technisch umsetzt. Vermutlich sieht es aber nach seiner Problemschilderung anders aus...

Mit willkürlichem STP meinst du sicher nicht sauber konfiguriertes STP, oder ? Ja, da hast du Recht. Die Bridge Priority muss auf den beiden Core Systemen entsprechend gesetzt werden, das diese beiden Maschinen immer die Root- und Backup Root Bridge sind ! Das ist ein einfaches Kommando.
Dann gibt es in einem Netzwerk auch keine Unterbrechungszeiten für eine Neuberechnung der Spanning Tree Hierarchie.
Heute gibt es aber RSTP (Rapid Spanning Tree, 802.1w) Eine kompatible Weiterentwicklung des klassischen STP Protokolls. Hier hast du Neubrechnungszeiten von weit unter einer Sekunde, so das dies nichtmal in VoIP Netzen zu einer Unterbrechnug führt. Damit ist so ein Verhalten auch Geschichte...
Als Latenz bei Switches bezeichnet man gemeinhin die Laufzeit eines Packetes durch die Hardware des Switches von einem Port zum anderen. Latenz ist im Umfeld von STP so in der Bedeutung nicht gebräuchlich.

So nun aber der Condor...
Member: condor83
condor83 Mar 12, 2008 at 06:18:12 (UTC)
Goto Top
Morgen...

erst mal danke für eure mühen!

Bin noch nicht so lange in der IT branche und zähle mich daher erst mal als anfänger. Ich habe dieses schulnetzwerk erst vor gut 1 1/2 Jahren übernommen und daran nichts verändert a la "Never touch running systems". ich bin immer nur ein bis 2 mal die woche in der schule, daher meine späte antwort. Mein problem ist dass einige switches schon recht alt sind und für diese keinerlei unterlagen mehr existieren, sowie auch keine unterlagen über den genauen aufbau des netzwerkes. das heißt für mich, dass ich erstmal kabel-verfolgen und das ganze netzwerk neu aufbauen kann (1 hauptswitch - und daran alle klassenswitches) - ein redundantes system werd ich dort nicht machen können. Wegen der einstellungen für STP müß ich mich in dem zusammenhang erst informieren - kannte dies bis dato noch gar nicht - klingt aber sinnvoll!

Da ich nur begrenzte zeit für diese schule zur verfügung habe weiß ich nicht wie schnell ich mit neuen erkenntnissen komme - werd mich heute mal an die arbeit machen

danke für eure hilfestellungen
heute abend gibts weitere infos

lg
Member: aqui
aqui Mar 12, 2008 at 09:02:48 (UTC)
Goto Top
Wenn du wenigstens den Hersteller der Switches weisst (Steht meistens vorne drauf !), dann ist doch das Beschaffen von Handbüchern über die Herstellerseite kein Problem, oder ? Das weiss man doch auch ohne lange in der IT Branche zu sein, oder ? (Dr. Google ist dein Freund wie immer...)

Es tut auch nichts zur Sache ob du ein redundantes System realisieren kannst oder nicht. Für eine Schule ohne die Anforderung an ein sicheres Netz ist das ja auch mehr oder weniger irrelevant. Aus Sicht der Stabilität und Störbarkeit durch experimentierfreudige Schüler aber nicht !!
Vermutlich stecken Schüler ein Loop oder experimentieren mit Karteneinstellungen rum die das Netz kollabieren lassen.
Letztlich kann man dir aber nur raten dich schnellstens über die Topologie des Netzes und Einstellungen der Switches zu informieren und wenigstens eine Minimaldokumentation anzufertigen.
Ohne solche Grundlage ist doch alles wie das Blicken in eine Kristallkugel... was letztlich zu nix führt als Raterei aber nicht zur Lösung deines Problems....
Member: condor83
condor83 Mar 12, 2008 at 14:14:19 (UTC)
Goto Top
Jap - Dokumentation - hab ich heute gemacht - hab jetzt zumindest einen hauptswitch an dem der server, Internetgateway und alle klassen und verwaltungsswitches hängen - und hab das ganze mitdokumentiert. die vorhergehende zusammensetzung war katastrophal (einfach immer einen switch irgendwo dranngehängt...)

von herumpfuschen der schüler gehe ich nicht aus, da es 1. immer wieder auftritt, auch am nachmittag wenn das haus so gut wie leer ist. 2. es eine hauptschule ist, da sind die meisten noch mit minesweeper beschäftigt *g*. und 3. die notebooks bei der anmeldung in der schule keine rechre haben, um irgendetwas zu verändern.

dass ich mir alle infos zu den switches im internet holen kann ist mir schon klar. aber das wird zeit benötigen und ich habe nur wenig zeit für diese schule zur verfügung und muß die ca 170 Notebooks der schüler auch warten (di des öfteren mal runterfallen oder sonstiges...)

ich werd mal schauen ob die neustrukturierung was gebracht hat - in der karwoche bin ich auf urlaub und wenn das problem weiterhin besteht wird mir eh nichts anderes übrig bleiben als alle switches (jeder eine andere marke) durchzugehen

danke erstmal für alle die geholfen haben - ich melde mich mit den nächsten neuigkeiten wieder

lg
Member: Yoshi-GP
Yoshi-GP Mar 12, 2008 at 14:18:04 (UTC)
Goto Top
Vielleicht noch einen Tipp:

Schau Dir mal die Konfiguration der Switche an. Du weißt ja nicht, was der vorhergehende Betreuer dort eingestellt hat.

Wir sind gespannt.

Gruss Jan