shearer9
Goto Top

STP Blocking auf Core Switch

Hallo,

seit etwa 2 Wochen begann in unserem Betrieb mit etwa 40 Clients das Problem, dass unser Netz für ein paar Sekunden weg war.
Habe bei den Logs auf dem Hauptswitch gesehen, dass folgender Eintrag vorhanden ist:
2147421487 19-Sep-2017 08:34:14 Warning %STP-W-PORTSTATUS: 1/g12: STP status Blocking
und das eben bei allen Ports.
Da es aber einmal in der Woche auftrat habe ich mir noch keine großen Sorgen gemacht, danach in der zweiten Woche kam das Problem 3mal da begann ich die Fehlersuche.
Da im Netz bis auf einen Switch nichts verändert wurde und das seit einem halben Jahr machte es für mich nicht einfacher. Den besagten Switch habe ich wieder gegen den alten ausgetauscht wo es nie zu Problemen gekommen ist, danach alle Switches im Netz kontrolliert ob eh überall Spanning Tree auf enabled steht und rstp verwendet wird.
Das alles hat aber nicht gefruchtet da ich seit heute schon 3 Netzausfälle hatte. Schleife im Netz habe ich eigentlich nirgends gefunden, morgen kommt ein neuer Switch da ich nicht ausschließen kann ob der das Problem ist.
Jetzt die Frage an euch, was könnte dieses Problem noch auslösen, das komische ist ja dass es nicht reproduzierbar ist und auf einmal kommt dann funktioniert es wie letzte Woche fast die ganze Woche wieder aber seit heute kommen die Fehler verstärkt.

Es handelt sich um einen Netgear GS748TPS der die Probleme verursacht.

Bitte um euren Rat.

Danke
Günther

Content-Key: 349475

Url: https://administrator.de/contentid/349475

Ausgedruckt am: 28.03.2024 um 21:03 Uhr

Mitglied: aqui
aqui 19.09.2017 um 09:49:25 Uhr
Goto Top
anach alle Switches im Netz kontrolliert ob eh überall Spanning Tree auf enabled steht und rstp verwendet wird.
Das ist nur die halbe Miete !!
Tunlichst solltest du immer zwingend in einem STP aktiven Netz den Root und Backup Root Switch über die globale STP Priority bestimmen !!
Dioe Priority Werte müssen immer modulo 4096 eingestellt werden also 4096---8192---12288---16384---20480---24576---28672---32768.
Der Default ist 32768 !
Der Root Switch sollte also auf sowas wie 8192 gesetzt sein. Kleinerer Wert = Höhere Priority.
Machst du das nicht dann ermitteln die Switches das aus den Mac Adressen und da kann dann der kleine 5 Port Popelswitch auf dem Tisch der Sekretärin mit einmal der Root Switch des ganzen Netzes sein, was dann tödlich wäre und fatale Folgen hat.
Wenn nicht geschehen solltest du das also am Hauptswitch dringend so einstellen das der die höchste Priority hat. Alle anderen können auf dem Default verbleiben, denn die errechnen daraus selber den STP Baum.

Generell bedeutet ein Topology Change oder ein Port Blocking wie bei dir eine Loop Situation im Netz also eine Schleife die natürlich nicht sein sollte.
Das STP Protokoll reagiert dann natürlich entsprechend und blockt die entsprechenden Ports.
Bei dir vermutlich die falschen da du eine laien- und fehlerhafte STP Konfig in deinem Netz hast !
Abgesehen vom STP Customizing solltest du also auch immer nach der eigentlichen Ursache dieses Loops suchen, denn das bewirkt ja ursächlich dieses Problem.
STP hilft dir ja nur Schlimmeres zu verhindern, nämlich den Stillstand des Netzes.

Sofern du unterschiedliche Hersteller im Netz hast solltest du checken ob einer ggf. eine nichtkompatible STP Version wie PVSTP usw. aktiv hast. Sowas wäre auch fatal und führt zu Ausfällen.
Generell sollte man immer RSTP einsetzen entweder im Global Span Verfahren oder PVSTP (Per VLAN STP)
Billige, einfache Switches supporten meist nur Global Span und wenns hoch kommt vielleicht noch MSTP.
Das Spanning Tree Protokoll muss aber, wie du schon selber richtig oben sagst, immer komplett einheitlich sein auf allen Komponenten. Und..
Natürlich richtig customized sein (Priority), was bei dir vermutlich nicht der Fall ist.
Übrigens ist das Switch Log hier immer dein bester Freund beim Troubleshooting !!
Mitglied: shearer9
shearer9 19.09.2017 um 11:49:51 Uhr
Goto Top
Hallo aqui,

du hattest recht mit der STP Prio die war bei jedem auf 32768 eingestellt, habe den Hauptswitch auf 4096 und den zweiten auf 8192 gesetzt.
Wegen dem Loop ansich der muss ja eigentlich am Hauptswitch liegen wo die Ports geblockt werden oder verstehe ich das falsch. Dann hätte ich ja einen Ansatz wo ich suchen könnte.

Zur Info haben überall den gleichen Hersteller an Switch von dem her sollten wir im grünen Bereich liegen.
Mitglied: aqui
aqui 19.09.2017 aktualisiert um 14:53:09 Uhr
Goto Top
die war bei jedem auf 32768 eingestellt
Typischer Kardinalsfehler. Sollte man aber eigentlich als Netzwerker wissen ?!
Wegen dem Loop
Der Dativ ist dem Genitiv sein Tod... !!! http://gfds.de/wegen-fall-nach/
oder verstehe ich das falsch
Das verstehst du falsch !
Der STP ist eine Baumstruktur. Der Port der am weitesten vom Loop weg ist mit der geringsten Priority geht in den blocking Mode !
Es kommt also
  • a. darauf an wie die Priority Struktur aussieht
  • b. wo genau der Loop entsteht.
Gute Switches haben ein detailiers Show Kommando mit dem du STP Topology Changes ansehen kannst oder loggen kannst. Ein Loop bedeutet immer einen sofortigen Topo Change.
Anhand dieser Log Meldungen kann man immer sehen welcher der verursachende Port ist ist.
Das ist das Grundübel und den musst du finden !
haben überall den gleichen Hersteller an Switch von dem her sollten wir im grünen Bereich liegen.
Sollte so sein...muss aber nicht.
Viele bessere Hersteller supporten auch die MSTP und PVSTP Derivate in der Konfig.
Da kann man dann zwar den gleichen Hersteller haben aber die falsche Konfig face-wink
Gut ist wenn durch die Bank alle mit RSTP laufen und ob das im Global Span oder PVST läuft ist vom Herstellersupport und deiner Konfig abhängig.
Die Billigheimer können meist eh nur Global Span...wie bereits gesagt.
Mitglied: clSchak
clSchak 19.09.2017 um 15:13:34 Uhr
Goto Top
Hi

um @aqui s Argumente weiter auszubauen: im Core empfiehlt es sich eher auf Protokolle zu verwenden die kein STP erfordern (z.B. TRILL von Brocade oder vergleichbares), damit umgehst die gesamte Problematik das dir dein "Client" Netz dein Core Netz zerlegt weil da irgendwo ein Loop gesteckt wurde.

Und wegen dem Loop am Hauptswitch: nein muss es nicht, aber ggf. hat der als erstes geschaltet und den Port dicht gemacht wo der andere Switch noch am "überlegen" war was er machen soll.

Rootbridge Changes würde ich auf jeden Fall überwachen, dass kann dir mal eben das Netz für 30-60s lahmlegen.

Gruß
@clSchak
Mitglied: aqui
aqui 20.09.2017 um 09:55:11 Uhr
Goto Top
Full ACK ! face-smile