whatever
Goto Top

Netzwerflackerer - NIC geht schnell an-aus-an-aus...

Hallo Netzwerkspezialisten, Erfahrene und Ideenfinder,

folgendes "Problem" begleitet uns nun schon seit Jahren:

Wir nennen es den 'Netzwerkflackerer'.
Die Verbindung der Netzwerkkarte schaltet sich plötzlich mehrfach ein und aus; schnell
hintereinander weg, manchmal kurz, manchmal über 2-3 min., selten länger.
Danach ist meistens Ruhe oder es zieht sich noch mal 3-4x über den Tag.
Unter XP konnte man das schön am Netzwerkicon sehen, welches an-aus-an-aus blinkte, als
hätte jemand einen nervösen Finger auf einer Klingel.
Im Ereignislog findet sich lediglich der Eintrag, dass die NIC an- und abgeschaltet wurde.

Was wir probiert haben und sich mittlerweile in unserer IT-Landschaft verändert hat:

Früher hat es geholfen das Patchkabel zwischen Rechner und Dose zu ziehen und wieder
einzustecken. Manchmal mit einem Ausschalten des Rechners inkl. Stromkabel abziehen
und kurz warten dazwischen.
Mittlerweile hilft in 95% der Fälle ein zurücksetzten des IP-Stacks über
netsh int ip reset + Neustart.

Zuerst haben wir es über eine zusätzlich verbaute NIC versucht, statt der OnboardNIC;
wir sind im Laufe der Jahre von Windows XP 64bit auf Window 7 Ultimate gewechselt;
haben alle Profile schon mind. 2-3x neu erstellt [nicht extra deswegen];
sind von einem HP ProCurve4108gl zu einem PowerConnect 6248 (stacked Switch) gewechselt;
haben mehrere IP-Ranges durch;
haben von DHCP zu festen IPs gewechselt und wieder zurück;
die Workstations wurden über 1-2 Generationen komplett ausgetauscht;
mit den wechselnden Workstations wechselten auch die OnboardNICs (Intel/Broadcom);
eigentlich hat sich die gesamte Hardware (Monitore, Server, USVs, etc.) getauscht;
das CAT6-Netzwerk ist mittlerweile ein CAT7-Netzwerk;
die Patchkabel wurden mehrfach gewechselt - verschiedene Hersteller;
wir sind sogar geografisch umgezogen - mehr als 6 Kilometer!

Hat alles nichts genützt. Und noch mal: Nein, wir haben das nicht alles wegen diesem
Flackerer gemacht, das hatte eher Wachstums- und Arbeitsprozessgründe!

Konstanten:
Es ist die selbe Stadt;
die meisten Mitarbeiter sind noch da;
soweit es auffälig ist leiden nur Workstations darunter;
ein einzelner Server mit Server 2003 R2 und Exchange (und einigen gewechselten Rollen)
ist von allen Wechseln bisher verschont geblieben, was allerdings als Ursache extrem
absurd klingt. Aber wer weiß.

"Gebäude wurde auf einem alten Indianerfriedhof gebaut" halte ich ebenfalls für
ausgeschlossen, da dies dann für beide Gebäude gelten würde.

Zwischenzeitlich haben wir im Switch und an den Workstations die Geschwindigkeit von
Automic auf 1GbE Full Duplex eingestellt und dachten, wir hätten es endlich, aber nach
Monaten schaute das Flackern plötzlich wieder kurz vorbei.

Es passiert nicht mehr so oft wie früher, es scheint auch nicht durch die Jahreszeit
bedingt. Möglicherweise sind wir verflucht und verdammt - sehr wahrscheinlich sogar,
aber mit sowas??


Mehr kann ich leider nicht anbieten.
Vielleicht aber einer von Euch.

Irgendwelche Ideen oder gar Erfahrungen mit dieser Konstellation?


Grüße
whatever

Content-Key: 203661

Url: https://administrator.de/contentid/203661

Ausgedruckt am: 28.03.2024 um 22:03 Uhr

Mitglied: mrtux
mrtux 20.03.2013 um 15:31:06 Uhr
Goto Top
Hi!

Was von dem ganzen Geraffel hängt an der USV und was nicht? Mal das Stromnetz von einem Elektriker auf Schwankungen messen (Langzeitmessung) lassen ? Hast Du dir mal das Messprotokoll der Verkabelung angesehen? Hast Du mal einen Langzeitsniff gemacht? Habe ich was vergessen? face-wink

mrtux
Mitglied: whatever
whatever 20.03.2013 aktualisiert um 15:53:23 Uhr
Goto Top
Zitat von @mrtux:
Hi!

Was von dem ganzen Geraffel hängt an der USV und was nicht?

PC6248-Switche haben in der alten Location irgendwann auch mal an einer USV gehangen.
In der neuen Location hängen sie definitiv immer dran; allerdings hat auch die USV (verschiedene Hersteller) schon 2x gewechselt.
Ansonsten hängt mittlerweile noch eine Netzteilseite der Disk-Arrays dran und der Server. Die andere Netzteilseite hängt auf einem anderen Stromkreis.

Mal das Stromnetz von einem Elektriker auf Schwankungen messen (Langzeitmessung) lassen ?

Nein, nicht auf Langzeit.
Allerdings ist es mittlerweile ein anderer Stadtteil, zwar gleicher Versorger, aber andere Einspeisung und die Verkabelung in unserem Gebäude ist angeblich hervorragend - was natürlich keine Schwankungen abhält.

Hast Du dir mal das Messprotokoll der Verkabelung angesehen?

Ja, nichts auffälliges soweit ich das beurteilen kann. Darüber hinaus hat sich ja auch die Verkabelung von Cat6 (alte Location) auf Cat7 (neue Location) verändert.

Hast Du mal einen Langzeitsniff gemacht?

Ja, aber wieder aufgegeben, weil der blöde Flackerer nicht aktiv geworden ist. Er ist schlau.
Leider wechselt er ja auch die Maschinen und ist nicht zu triggern.
Vielleicht sollten wir den Sniff mal wieder anschmeißen.

Habe ich was vergessen? face-wink

Dir fällt sicher noch was ein.

mrtux

Ich behaupte es ist der typische Userfehler. Kann gar nicht anders sein... face-plain
Mitglied: brammer
brammer 20.03.2013 um 16:28:06 Uhr
Goto Top
Hallo,

immer dieselbe NIC; respektive lässt es sich auf einen Hersteller eingrenzen?
Onboard Karten?
Gesteckte Karten?
Selber Rechner Typen?


brammer
Mitglied: whatever
whatever 20.03.2013 aktualisiert um 17:02:01 Uhr
Goto Top
Zitat von @brammer:
Hallo,

immer dieselbe NIC; respektive lässt es sich auf einen Hersteller eingrenzen?
Onboard Karten?
Gesteckte Karten?

Nein, keine Eingrenzung.
Wir hatten es auf OnboardNICs (Intel und Broadcom) und auf zusätzlich gesteckten Intel NICs (Desktop- und Server-Variante), während die Onboard im BIOS abgeschaltet war. Eine Linksys noch, glaube ich.

Selber Rechner Typen?

Jain. Dell Precision 690 (IntelNIC, wenn ich mich recht entsinne), Precision T7400 und mittlerweile T7500 (beide mit Broadcom).

brammer

Möglicherweise ist es auch auf anderen Systemen (Server, Buchhaltungsrechner oder Notebooks) aufgetaucht, aber die User haben es einfach nicht gemerkt oder sich nicht gemeldet, weil es nach ein paar Minuten wieder mit dem Netzwerk lief und nicht mehr auftrat.
Mitglied: SamvanRatt
SamvanRatt 20.03.2013 um 21:33:51 Uhr
Goto Top
Hi
was passiert denn wenn du einen weiteren Switch dazwischen steckst? Hält das Flackern dann am NIC, Down oder Uplink fest?
Gruß
SAm
Mitglied: 108012
108012 20.03.2013 aktualisiert um 22:04:02 Uhr
Goto Top
Hallo,

mein Tipp defekte USV, defektes Stromkabel, im Rack etwas nicht geerdet oder eine defekte Steckdosenleiste!
Mal kommt es zum Kontakt, dann flackert es und mal nicht! Brüchige und/oder alte Kabel (LWL oder Patchkabel)
zu wenig Energie im Gebäude oder nur eine Stromversorgung aber zu viele Abnehmer vorhanden, wäre auch noch eine
Möglichkeit.

Der Switch an dem die WS hängen, die Stromquellen alle einmal abgehen und nachsehen, bitte.
ruhig auch mal die Kabel bewegen und dann muss eben jemand den "Sucher" machen und einer den "Beobachter"
so einfach ist das.

Falsch konfigurierter Switch mit einem LAG oder einem VLAN was nur noch an einem Ende vorhanden ist würde auch noch evtl. rein passen?

Gruß
Dobby
Mitglied: MrNetman
MrNetman 20.03.2013 um 21:48:28 Uhr
Goto Top
Hi,

ist das ein energieintensiver Betrieb?
Gibt es große Stromverbraucher, die evtl. was mit Schweißen oder Elektroöfen zu tun haben.
Ich frage wegen etwaiger temporärer Potentialverschiebungen, die in leichten Fällen zu Bitfehlern und damit etwas reduzierter Geschwindigkeit oder aber zu starken Schwankungen im Netz und darum zum Verlust des Links führen könnten.

Gibt es diese Ausfälle nur bei den Workstation oder auch bei den Switchtes, der infrastruktur. Interswitch-Links, den uplinks. Oder sind die gar Glasfaser?

Gruß
Netman
Mitglied: whatever
whatever 21.03.2013 aktualisiert um 12:52:32 Uhr
Goto Top
Zitat von @SamvanRatt:
was passiert denn wenn du einen weiteren Switch dazwischen steckst? Hält das Flackern dann am NIC, Down oder Uplink fest?

Weiß ich leider nicht, haben wir nie ausprobiert. Ich wüsste auch nicht genau wie, außer beim Auftreten umgehend einen Switch dazwischen zu klemmen und hoffen, dass der Effekt sich erneut auslöst.
Ich kann das ja mal so für das nächsten Auftreten zurechtlegen.


Zitat von @108012:
Hallo,

mein Tipp defekte USV, defektes Stromkabel, im Rack etwas nicht geerdet oder eine defekte Steckdosenleiste!
...
zu wenig Energie im Gebäude oder nur eine Stromversorgung aber zu viele Abnehmer vorhanden, wäre auch noch eine Möglichkeit.

Bei gewechselter Hardware und Standortwechsel finde ich das immer noch extrem suspekt.
Rein logisch kann das nicht gehen.
Hmm, aber wir reden hier von IT und Computern, da hab ich schon einiges erlebt, was eigentlich nicht sein kann...

Der Switch an dem die WS hängen, die Stromquellen alle einmal abgehen und nachsehen, bitte.
ruhig auch mal die Kabel bewegen und dann muss eben jemand den "Sucher" machen und einer den "Beobachter"
so einfach ist das.

Nee, das ist ungefähr "so einfach", wie die beliebte Aussage "mal eben schnell".
Wenn sämtliche Kabel, Stromnetze/-leitungen, USVs und Switche gewechselt haben, dann kann das doch eigentlich gar nicht ...ich wiederhole mich.

Falsch konfigurierter Switch mit einem LAG oder einem VLAN was nur noch an einem Ende vorhanden ist würde auch noch evtl.
rein passen?

LAG gibt es nur zu den Servern, nicht bei den Workstations. VLAN ist erst seit kurzem mit definiert.
Der Effekt trat meiner Erinnerung nach auch schon beim ProCurve ohne LAG-Config auf.


Zitat von @MrNetman:
...
ist das ein energieintensiver Betrieb?
Gibt es große Stromverbraucher, die evtl. was mit Schweißen oder Elektroöfen zu tun haben.
Ich frage wegen etwaiger temporärer Potentialverschiebungen, die in leichten Fällen zu Bitfehlern und damit etwas
reduzierter Geschwindigkeit oder aber zu starken Schwankungen im Netz und darum zum Verlust des Links führen könnten.

Nein, tut mir leid, damit kann ich leider nicht dienen, auch wenn das nach einem schönen Auslöser klingt.

Gibt es diese Ausfälle nur bei den Workstation oder auch bei den Switchtes, der infrastruktur. Interswitch-Links, den
uplinks. Oder sind die gar Glasfaser?

Kein Glasfaser, alles Kupfer. Ausfälle sind bisher immer nur bei Workstations zu beobachten.
Der Effekt "wandert" zwischen mehreren Workstations, befällt nur einen kleinen Anteil, ist nicht triggerbar, und hält sich nur vage an bestimmte Workstations und User.
Es gibt also schon Kandidaten, bei denen es öfter auftaucht, aber selbst mit ganz ausgetauschter neuer Workstation (und Userprofil) kann der Effekt zurückkommen. Oder plötzlich ist jemand ganz anderes betroffen.
Ist so ein bisschen wie eine Grippe - manche sind anfälliger, werden aber nicht immer krank.

Gruß
Netman



Danke schon mal an alle, die bisher versucht haben mit Antworten, Fragen und Ideen eine Richtung zu definieren.