coldzero
Goto Top

Kernel Panic nach 2 Minuten Laufzeit!

Moin Moin,

wiedereinmal wende ich mich an euch, diesesmal nicht bezüglich Windows sondern bezüglich eines Unix systems.

Wir haben einen sogenannten LOGServer, BS Centos5.2, dieser lief nun etliche jahre ohne Probleme in unserem Datacenter in einem Reck.

Aufeinmal war der Server nicht mehr über SSH zu erreichen. Also sind wir hingefahren und geprüft was er für Probleme haben.
Nach dem Rebooten lief er 2 Minuten und bekommt dann einen "Kernel Panic".

Also wir den Server mit ins Büro genommen, ab aufn OP-Tisch, aufgemacht und mal gestartet, läuft super das ding.
Also wieder in den Reck eingebaut, das selbe, Kernel Panic nach 2 Minuten laufzeit.

Wieder ins Büro, ALLE Komponenten getauscht, außer die HDDS ( 1 Mirror Raid, eine Hauptplatte auf der das BS läuft ) diese Getestet ohne Fehler. Wieder lief er im Büro 1a, ließ sich über SSH ansprechen und war glücklich, ab ins Reck mit dem und wieder Kernel Panic.

Der Logserver fürht keine Crontabs aus oder ähnliches, das einzige was er tut sind RSnapshots, die immer funktionierten und gemacht wurden.
Gut die platte war voll, wir also Alte Snapshots gelöscht damit er Platz hat, evt liegt dort das problem, auch nicht wieder Kernel Panic...

nun sind wir soweit das wir echt Ratlos sind wo das Problem liegen könnte... Haben in die Logs geschaut ob er uns was sagt, Booten tut er 1a, ohne murren und Knurren, sobald er in Produktiven Betrieb gehen muss, schmiert er weg!

Evt habt ihr noch ideen woran es liegen könnte.

Danke im vorraus.

Mfg Coldi

Content-Key: 115759

Url: https://administrator.de/contentid/115759

Printed on: April 19, 2024 at 11:04 o'clock

Member: dog
dog May 11, 2009 at 11:09:43 (UTC)
Goto Top
Nun, da würde ich sagen, das ist umgebungsinduziert face-smile

Evtl. DOSt einer der Logger den Server oder sendet Daten die den Syslog-Server zum Absturz bringen.
Du hast da drei Möglichkeiten:
  • Prüfen, ob die syslog Software aktuell ist
  • Mit Wireshark etc. den Traffic beobachten, ob etwas besonderes passiert, wenn der Server panict
  • Die Kernel-Log anschauen. Wenn es eine waschechte Kernel Panic ist, hilft da nur vom Bildschirm abschauen, ansonsten sollte in /var/log/messages was zu finden sein

Grüße

Max
Member: ColdZero
ColdZero May 11, 2009 at 11:16:23 (UTC)
Goto Top
Also auf möglicjhkeit 3 sind wir auch gekommen, NICHTS

mit Syslog und nen bisschen Sniffen gute idee, was halt als letztes passiert bevor er die gretsche macht. gut gut, danke werd ich mal Probieren.


EDIT:

So hat sich erledigt
konnte cheffe nicht überzeugen einmal zwischen zu sniffern, wäre lustig geworden =D

Er Deaktiviert alle Crons und das NFS und schaut ob er immer noch panict.

Eine Information die mich eben erreicht hat, sobald er Netzwerk bekommt Panict er. Ohne Network bootet er einwandfrei und läuft auch, Netzwerk Drinne und er Panict SOFORT, also irgendwas am Trafiic wird es sein, aber cheffe will lieber den umweg gehen und neu Aufsetzen. Kann ich nichts gegen sagen.

Dennoch Danke.
Member: ColdZero
ColdZero May 12, 2009 at 09:17:56 (UTC)
Goto Top
Moin Moin,

Also weitere Information die mich heute morgen erreicht hat:

Der Kernel Panic kommt vom NFS!

Was könnte da nun schief gehen?
Member: dog
dog May 12, 2009 at 14:08:36 (UTC)
Goto Top
Hm, fällt mir so erstmal nichts weiter zu ein...
Member: ColdZero
ColdZero Jun 10, 2009 at 07:24:04 (UTC)
Goto Top
Haben das Problem mehr oder weniger gelöst. NFS Deaktiviert und fertig. Läuft wie heißes Messer durch Budder ;)