bitstash
Goto Top

Stromausfall - boot failure - MBR, Board oder Raid-Controller defekt?

Hallo zusammen,

wir hatten heute über mehrere Stunden einen Stromausfall, den die USV leider nicht mehr abdecken konnte. Ich hab es leider nicht rechtzeitig geschafft alle Systeme zu beenden, bevor die USV versagte.
Als dann irgendwann der Strom wieder kam, hörte ich auch schon die USV fiepen ... wunderlich. Hab dann wärend des Booten wie alle Server erneut ausfielen ... die Sicherung hat die zahlreichen Neustarts nicht mehr getragen und ist rausgesprungen! Als ich das Problem gelöst habe und unseren primären DC startetet, hing der Boot bei der Fehlermeldung "boot failure - press any key ...". Die Boot-Reihenfolge sieht wie folgt aus: 1. RAID 2. Netzwerkboot 3. Efi.
Er springt beim booten sofort zum PXE-E61 Error, sprich er übergeht das Booten vom Raid/HDD. Ich gehe stark davon aus das nicht der Stromausfall an sich das Problem war, sondern viel mehr der erneute Stromausfall (Sicherung) beim Booten des Server. Was kann da passiert sein? MBR kaputt? Hat es das Board hops genommen? Raid-Controller defekt (Kurzer etc.) ? Das Bios erkennt alle Komponenten, soweit ich das erkennen konnte, korrekt. Ich würd wohl zuerst versuchen über die Win2003 CD in der Console den MBR zu reparieren und bei Misslingen ggf. schauen ob ich die Partitionen mit Hilfe von Ubcd lesen kann. Ich hab nur etwas Angst etwas zu zerschießen (Raid5 mit ner Menge Daten) und wollt mich deshalb vorab hier informieren, was ich geschickter Weise tun sollte / beachten sollte. Danke für die Tipps!

Gruß

Content-Key: 115252

Url: https://administrator.de/contentid/115252

Printed on: April 19, 2024 at 10:04 o'clock

Member: mrtux
mrtux May 04, 2009 at 18:36:41 (UTC)
Goto Top
Hi !

Zitat von @bitstash:
Hallo zusammen,

wir hatten heute über mehrere Stunden einen Stromausfall, den
die USV leider nicht mehr abdecken konnte. Ich hab es leider nicht
rechtzeitig geschafft alle Systeme zu beenden, bevor die USV
versagte.

Ich frage mich als erstes, was ihr für eine USV habt, noch mit Kurbel hinten dran ?
Die ich bisher installiert habe, haben ein seriell oder Usb-Kabel mit dem man den Server und weitere PCs sauber herunterfahren kann und zwar bevor der USV der Saft ausgeht.

alle Server erneut ausfielen ... die Sicherung hat die zahlreichen
Neustarts nicht mehr getragen und ist rausgesprungen! Als ich das

Frage zwei, wer war euer "Elektriker" ? Hängen alle Server an einer Sicherung ?
Na bravo, absolut professionelle Elektroinstallation !

übergeht das Booten vom Raid/HDD. Ich gehe stark davon aus das
nicht der Stromausfall an sich das Problem war, sondern viel mehr der

Da kannst Du aber Gift drauf nehmen !

Frage drei, wer hat Eure IT-Anlage so versaubeutelt ? Das darf doch ned wahr sein. Hat die der Praktikant geplant ?

mit Hilfe von Ubcd lesen kann. Ich hab nur etwas Angst etwas zu
zerschießen (Raid5 mit ner Menge Daten) und wollt mich deshalb

Das hätte ich an Deiner Stelle auch und eine Datensicherung hast Du nicht oder ?

vorab hier informieren, was ich geschickter Weise tun sollte /
beachten sollte. Danke für die Tipps!

Das ist ein kluger Gedanke ! face-smile

mrtux
Member: dog
dog May 05, 2009 at 00:39:05 (UTC)
Goto Top
Frage zwei, wer war euer "Elektriker" ? Hängen alle Server an einer Sicherung ?
Na bravo, absolut professionelle Elektroinstallation !

Das ist doch mehr oder minder normal :D
Irgendwann wachsen die IT-Systeme, man kauft sich eine größere USV, die eben auch mal 16A ziehen kann, ohne dass Kabel und Sicherungen angepasst werden. Im normalen Betrieb ist das ja kein Problem.
Direkt nach einen Stromausfall kommt es allerdings dann zu einer enormen Lastspitze, weil alle Server gleichzeitig starten und die USV auch noch ihre Akkus laden will - da sagt die Sicherung natürlich dann (berechtigterweise!) "Nein, Danke".
Darum kann man z.B. bei APC-USVs einstellen, dass die nach der Rückkehr des Stroms X Minuten warten sollen bis sie wieder Strom abgeben.

Aber an bitstash:

Bevor du mit irgendwelchen Reparaturversuchen beginnst starte den Server mit einer Acronis BartPE CD oder eine Ubuntu Live CD - Hauptsache der RAID-Controller wird unterstützt und mach ein RAW-Backup des RAIDs.
Unter Linux also z.B.
dd if=/dev/sda of=/mnt/usbdisk/backup.iso

Erst wenn du das hast und es dabei keinen Fehler gab darfst du auch etwas an den Daten auf der Platte ändern - alles andere ist grob fahrlässig, da in der Aufregung nach einem Crash immer die meisten Fehler passieren.
Übrigens kannst du auch das RAW-Backup 1:1 auf eine andere Festplatte machen und damit erst mal experimentieren, ob du das Problem gelöst bekommst.
Halte dir einfach eins im Hinterkopf: Je mehr du machst, umso unwahrscheinlicher wird es, dass ein Datenrettungslabor noch helfen kann.

Grüße

Max
Member: mrtux
mrtux May 05, 2009 at 03:44:18 (UTC)
Goto Top
Hi Dog !

Zitat von @dog:
Direkt nach einen Stromausfall kommt es allerdings dann zu einer
enormen Lastspitze, weil alle Server gleichzeitig starten und die USV
auch noch ihre Akkus laden will - da sagt die Sicherung natürlich
dann (berechtigterweise!) "Nein, Danke".

Erzähl mir nix von Elektrotechnik, ich hatte auch mal einen ehrbaren Beruf, bevor ich in die Welt des Imaginären und Unfassbaren übersiedelte face-smile

Halte dir einfach eins im Hinterkopf: Je mehr du machst, umso
unwahrscheinlicher wird es, dass ein Datenrettungslabor noch helfen
kann.

Du bringst es auf den Punkt !


mrtux
Member: bitstash
bitstash May 05, 2009 at 06:01:20 (UTC)
Goto Top
Morgen,

sehe ich alles genauso. Max, das wär mein nächster Schritt gewesen -> Backup. Ich mache mich jetzt dran und guck was noch geht. Bis dato sieht es ganz danach aus, das der Contoller die angeschlossenen Festplatten nicht mehr erkennt, aber wie gesagt ich bin noch am Ursachen forschen. Ich meld mich später wieder, sobald ich neue Erkenntenisse habe ;)
Member: ahartmann
ahartmann May 05, 2009 at 07:26:33 (UTC)
Goto Top
@mrtux: solche posts helfen ihm nach dem crash nicht sonderlich weiter! ein forum ist nicht dazu da, sich nach einem supergau über den admin lustig zu machen, ein gescheiter tipp wäre da hilfreicher gewesen.

@bitstash: viel erfolg .-)

ich mache es prinzipiell so, das ich von jedem server die systempartition als acronis image habe und die bewegungsdaten als tägliches acronis backup sichere
Member: ahartmann
ahartmann May 06, 2009 at 07:39:22 (UTC)
Goto Top
@bitstash: wie ist es gelaufen?
Member: mrtux
mrtux May 06, 2009 at 13:02:36 (UTC)
Goto Top
Hi !

Zitat von @ahartmann:
@mrtux: solche posts helfen ihm nach dem crash nicht sonderlich
über den admin lustig zu machen, ein gescheiter tipp wäre da

Ich habe mich nicht über ihn lustig gemacht, meinst Du ich hatte solche Situationen nicht auch schon ? Aber wenn jemand heute einen Server ohne Datensicherung betreibt, hat das nix mit Administration zu tun, mich würde das Schlamperei nennen.

Und jeder, wirklich jeder, der in so einer Situation schon war, hat dabei was gelernt, da schliesse ich mich ganz bestimmt nicht aus.

@bitstash: viel erfolg .-)
tägliches acronis backup sichere

Im Moment hilft ihm das auch nicht, von daher Nase fassen.

mrtux