pithag
Goto Top

Server verliert Netzverbindung durch Watchdog

Der gleiche Beitrage steht auch im Bereich Netzwerke. Ein Ratschlag kam, der Beitrag gehöre eher zu Betriebssysteme. Daher hier einfach nochmal.

gelöst! (siehe unten)

Hallo,

ich administriere (so leidlich) ein Netz an meiner Schule. Nach den Osterferien ist nun ein Fehler aufgetaucht, den ich nicht in den Griff bekomme:
Das System (Suse 9.1 mit Samba + ext. Router) fährt normal hoch und funktioniert unregelmäßig lang (mal 15 Minuten, mal 4 Stunden...), dann bricht es zusammen, d.h. es ist von den Windows-Clients kein Zugriff auf die Netzlaufwerke mehr möglich. Der Server bleibt aber administrierbar.
Erst ein neues Hochfahren des Servers bringt wieder den normalen Netzbetrieb.

Bei den messages bin ich auf diese Fehlermeldung gestoßen, die ständig wiederholt wird:

linux kernel: NETDEV WATCHDOG: eth1 transmit timed out
linux kernel: eth1 Tx queue start entry4 dirty entry 0
linux kernel: eth1 Tx descriptor 0 is ffffffff. (queue head)
linux kernel: eth1 Tx descriptor 1 is ffffffff.
linux kernel: eth1 Tx descriptor 2 is ffffffff.
linux kernel: eth1 Tx descriptor 3 is ffffffff.

Der Fehler tritt auch mit der anderen Netzwerkarte eth0 auf.
Beide Karten habe ich bereits gegen neu ausgetauscht, ebenso die Patchkabel und die Steckplätze im Switch.

Woran kann es liegen, dass die Netzwerkkarten eine zeitlang funktionieren und dann ihren Betrieb einstellen?
Wer hat eine Idee?
Kann es am Switch liegen?

Vor den Ferien lief das System problemlos seit 5 Jahren, ich habe keine Änderung an der Hardware vorgenommen.
Da zur Zeit in der Schule das Netz immer wieder mal lahm liegt, wäre ich um schnelle Hilfe dankbar!

Pit

Content-Key: 57689

Url: https://administrator.de/contentid/57689

Printed on: April 23, 2024 at 09:04 o'clock

Member: Pjordorf
Pjordorf Apr 26, 2007 at 20:49:53 (UTC)
Goto Top
Autsch! da habe ich mich doch glatt vertan. Sorry.
Member: Oli-nux
Oli-nux Apr 27, 2007 at 11:32:08 (UTC)
Goto Top
Schau mal ob da was dabei ist.face-wink
http://www.google.de/search?hl=de&q=watchdog+transmit+timed+out& ...

Ich las etwas davon mit append = "noapic" zu booten......
Member: pithag
pithag May 03, 2007 at 09:18:19 (UTC)
Goto Top
Hallo zusammen!

Nachdem der Server jetzt seit einer Woche ohne Absturz läuft, gehe ich davon aus, dass das Problem gelöst ist.
In einem der verschiedenen Linuxforen (ich weiß nicht mehr in welchem) habe ich den entscheidenden Hinweis gefunden:
Man muss im BIOS APIC deaktivieren! Mit "noapic" zu booten brachte nichts!

Ich verstehe das ganze zwar nicht, bin jetzt aber froh, dass der Netzbetrieb wieder funktioniert.

Es bleiben aber Fragen offen:
Warum läuft das System 5 Jahre lang mit APIC und dann nicht mehr?
Wo liegt der Unterschied zwischen APIC imBIOS deaktivieren und mit "noapic" zu booten?

Bis demnächst mal wieder und danke für die Tips
Pit
Member: Oli-nux
Oli-nux May 03, 2007 at 13:00:00 (UTC)
Goto Top
Es bleiben aber Fragen offen:
Warum läuft das System 5 Jahre lang mit
APIC und dann nicht mehr?
Ich gehe davon aus, dass du auch Updates übers Internet machst.face-wink
Du wirst dich wundern was bei Updates als Endergebnis alles so rauskommen kann.face-smile
Member: pithag
pithag May 03, 2007 at 15:42:02 (UTC)
Goto Top
Da ich NICHT regelmäßig update (never change a running system)
darf ich diese Möglichkeit ausschließen!
Member: Pjordorf
Pjordorf May 03, 2007 at 15:58:38 (UTC)
Goto Top
Aber nur, wenn du 5 Jahre lang kein update gemacht hastface-smile
Member: pithag
pithag May 03, 2007 at 16:10:14 (UTC)
Goto Top
ungelogen!

Das einzigste, was mir gerade einfällt:
Ich habe vor den Ferien ein Programm deinstalliert (Französisch-Software), die sehr aufwändig zu administrieren gewesen wäre und eh nicht eingesetzt wurde.
Vielleicht hat die Deinstallation irgendwas zerschossen!