fboy33
Goto Top

Server Acer Altos g540 mit WIN Serv 2008R2 fällt öfters immer gegen 4.00 Uhr morgens aus

Hallo liebe Hotliner und Leidensgenossen/innen

ich habe seit ca. 4 Wochen ein unerklärliches Problem mit einem Acer Altos Server G540, der öfters gegen 4.00 (3.59 / 4.03 /3.59 / usw.) Uhr abstürzt, zwischen 3 und 8 Tagen Abstand.
Laut Ereignisprotokoll ist der Strom einfach weg... es befinden sich keinerlei sonstige Protokolleinträge um diese Uhrzeit in den anderen Bereichen. Keine Sicherung läuft um diese Uhrzeit, keine Bereinigung oder sonstige Upgrates o.ä.
Dies ist der Verwaltungsserver mit der Domäne; es gibt noch einen 2. Server im Netz, der als reiner Anwendungssoftware-Server läuft, der funktioniert ohne Probleme. Habe die USV vom anderen Server getauscht (evtl. Hardwareproblem der USV) aber leider kein Erfolg, heute morgen war der Acer wieder aus.
Leider gibt es nicht wie bei HP eine Systemanalyse der Hardware von Altos, wo evtl. ein Fehler ersichtlich wird.
Hat evtl. jemand sowas schon mal gehabt und eine Lösung, oder einen Suchweg für mich!?

Danke für jede Info!

Erhard Faak

Content-Key: 205847

Url: https://administrator.de/contentid/205847

Printed on: April 26, 2024 at 19:04 o'clock

Member: psannz
psannz Apr 30, 2013 at 09:59:05 (UTC)
Goto Top
Sers,

passt eventuell ein geplanter Task zu den Zeiten?

Event Logs vom BIOS geben auch keine Informationen aus?
Gibt es Fehler vom RAID Controller Utility? Wird wohl der LSI MegaRAID drauf laufen?

Wenn du den Server an ner USV dran hast, kannst du NUR den Server dran hängen und dann die Leistungslogs zum Zeitpunkt der Ausfälle befragen?

Grüße,
Philip
Member: fboy33
fboy33 Apr 30, 2013 at 11:59:45 (UTC)
Goto Top
Hallo Philip,

Danke für die schnelle Antwort, leider keine Infos zu sehen, die das "Ereignis" betreffen; ja es ist der LSI Logic Mega Raid SAS 8708 Controler verbaut, im RAID5 mit 3 HDDs.
Im Log. der USV ist auch nichts zu sehen, um 3.53 Uhr war der turnusmäßige Eintrag und dann erst wieder nach dem Neustart um 06.57 Uhr.
liebe Grüße Erhard Faak
Member: Deepsys
Deepsys Apr 30, 2013 at 12:35:22 (UTC)
Goto Top
Hi,

der hat doch 2 Netzteile, oder?
Dann häng doch mal eines an die USV und die andere an eine Nicht-USV-Dose.
Dann kannst du die USV ausschließen.

VG
Deepsys
Member: napperman
napperman Apr 30, 2013 updated at 12:52:15 (UTC)
Goto Top
Moin,
das erinnert mich an die Story eines Systemhauses, dass zur hilfe gerufen wurde, weil bei einem Kunden genau das passierte.
Der hatte nur einen Server. Es stellte sich dann heraus, dass die USV sowieso hinüber war. Warum der Server dann immer um die gleich Uhrzeit ausging erkärte das aber nicht. Bis dann ein Mitarbeiter des Systemhauses zur üblichen Absturzzeit im Serverraum war:
Tür fliegt auf, Putzfrau kommt rein, reißt den Stecker raus und stöpselt den Staubsauger an face-wink

Nun zur Hilfe:
Wenn der Server 2 Netzteile hat, einfach mal die Anschlüsse tauschen (USV und nicht-USV)
Könnte ja sein, das die USV spinnt und ein Netzteil, und wenn dann der Test der USV anläuft, das Teil ausgeht, weil das Netzteil das an Nicht-USV hängt schrott ist und die USV nicht richtig schaltet...

Außerdem würde ich den Test der USV mal manuell anstoßen. Vielleicht lässt sich dadurch der Fehler reproduzieren.
Member: fboy33
fboy33 Apr 30, 2013 at 13:03:58 (UTC)
Goto Top
Danke für die schnellen Antworten...
Da an jedem Server eine eigene USV hängt, habe ich die beiden USVs einfach getauscht, trotzdem ging der "richtige" Server wieder aus, also kann es an der USV nicht liegen.
Der Server wurde vor 4 Jahren noch ohne dem 2. Redundaten-Netzteil geliefert, so kann ich da leider nichts testen.
Weil es immer gegen 04.00 Uhr (+- 2 min.) passiert, haben die MA alles in der Firma überprüft, um diese Zeit ist niemand im Büro und auch die Heizung fährt dann nicht hoch, und auch keine Maschinen werden dann gestartet. Der Arbeitsbeginn ist erst um 06.00 Uhr. Da die USV normalerweise alles was übers Stromnetz geschieht filtert, kann es meiner Meinung nur intern im Server passieren...

tschüs Erhard Faak
Member: Deepsys
Deepsys Apr 30, 2013 updated at 13:31:51 (UTC)
Goto Top
Hi,

hmm, da hat nicht zufällig irgendein Scherzbold im BIOS ein automatisches Ausschalten oder so eingestellt?
Oder über die USV den Port abgeschaltet?

Ich würde mal die USV komplett herausnehmen, so oft gibt es ja auch keinen Stromausfall.

Tja, und im absoluten Notfall musst du wohl mal den Wecker früh stellen face-wink

VG
Deepsys
Member: psannz
psannz Apr 30, 2013 at 14:34:38 (UTC)
Goto Top
Und Tasks (taskschd.msc) sind auch keine für den Zeitraum eingerichtet?
Member: fboy33
fboy33 Apr 30, 2013 at 15:51:57 (UTC)
Goto Top
Hallo psannz,
habe gerade noch mal auf dem Server nachgesehen, es läuft keine Task um die Uhrzeit, oder könnte da aufhören...

liebe Grüße Erhard Faak
Member: psannz
psannz Apr 30, 2013 at 18:40:12 (UTC)
Goto Top
Schade, dann fällt mir auf die schnelle zu den Symptomen auch nicht mehr ein. Obwohl... Hast eine Möglichkeit Hardwarewerte mitzuschneiden? Also Temperatur, Lüfterdrehzahlen, etc, etc? Wenn du da noch nichts hast, mit HWmonitor konnt man das - iirc - auch in ne csv loggen lassen. Das könnte eventuell noch Aufschluss geben. Das und die Leistungslogs der USV halt...

Das wars für heute, schönen Feiertag euch.

Grüße,
Philip
Mitglied: 108012
108012 May 01, 2013 at 00:35:43 (UTC)
Goto Top
Hallo Erhard,

- Das Netzteil mal tauschen!
- Den Server einmal aufmachen (aufschrauben) und nach einem geplatzten Elko Ausschau halten
- Die Batterien der USVs einmal überprüfen
- Die Festplatten haben eventuell einen defekten Block und immer wenn an der Stelle auf der HDD geschrieben wird stürzt der Server ab, kann das sein.

Also mein Tipp defektes Netzteil oder ein defekter bzw. geplatzter Elko auf dem Mainboard.


Gruß
Dobby
Member: fboy33
fboy33 May 01, 2013 at 10:57:12 (UTC)
Goto Top
Hallo Philip (psannz),
mit HWmonitor müsste ich es mal ausprobieren... Danke!

Hallo Dobby,
Netzteil tauschen habe ich auch schon gedacht, nur das bekommt man nur noch bei Acer, für viel - viel Geld und wenns dann nicht ist, hat der Kunde über 500 € ausgegeben...
Auf geplatzte Elkos habe ich nicht geachtet, aber bei 4 Jahren und Server hab ich an sowas auch noch nicht gedacht, aber wer darf schon bei IT denken *grins*.
Da der Absturz immer um 4 Uhr (+- 2 Minuten) geschieht, denke ich eher an einen systematischen Fehler (SW) nur ich hab keine Erklärung was es sein könnte, da ich alle mir bekannten Protokolle und Ereignisse bzw. Tasks angesehen habe. Die USVs sind erst 6 Monate alt und die habe ich gegeneinander schon getauscht, trotzdem trat genau wieder am Acer der Absturz auf.

tschüs und einen hoffendlich ruhigen Tag der Arbeit, ich sitze im Büro, da heute kein Kunde anruft und ich in Ruhe arbeiten kann.

Erhard Faak
Mitglied: 108012
108012 May 01, 2013 at 15:23:35 (UTC)
Goto Top
Netzteil tauschen habe ich auch schon gedacht, nur das bekommt man nur noch bei Acer, für viel - viel Geld und wenns dann nicht ist, hat der Kunde über 500 € ausgegeben...
ok, ok, ok, das Geld würde ich auch nicht ausgeben wollen, das Thema ist dann wohl durch!

Da der Absturz immer um 4 Uhr (+- 2 Minuten) geschieht, denke ich eher an einen systematischen Fehler...
Also, ich hatte mal so ein ähnliches Problem obwohl ich eine USB Maus und Tastatur hatte lief der PC den ganzen Tag gut, nur wenn ich einen bestimmten Drucker benutzt habe kam ein BlueScreen und der
PC verabschiedete sich schlagartig! Nach näherer Betrachtung des Mainboards habe ich dann so etwas hier gefunden und dann war der Fall erledigt!!

Die USVs sind erst 6 Monate alt...
Ok dann sind die es wohl auch eher nicht!

Habt Ihr eventuell Eure Telekom Zwangstrennung morgens um 04:00 Uhr bei Euch?
Hast Du die Festplatten einmal gecheckt ob es da einen Bad Sektor gibt und der Server abstürzt
wenn ab und an dort drauf geschrieben wird?

Gruß
Dobby