vip3234
Goto Top

Nach Festplatten Fehler Bluescreen beim Starten des W2k8 R2 Servers (0x000000f4, 0x00000021)

Hallo zusammen,

ich habe folgendes schwerwiegende Problem.

1. Setup
  • Hostserver mit Windows Server 2008 R2 Enterprise installiert auf RAID1 Festplattenverbund
  • 2 Virtualisierte Win2k8R2 Server (1x DC, 1x Exchange, IIS etc.) die per Hyper V vom Host virtualisiert werden die VHDs der virtualisierten Server liegen auf einem RAID10 (4 Festplatten a 500GB) Festplattenverbund des Host Systems

2. Der Vorfall
  • Bei einer Systemwartung wurde festgestellt, dass der Raidcontroller (LSI) des Hostrechners eine der 4 Festplatten des RAID10 wegen zu häufiger Lesefehler abgeschaltet hatte. Die Festplatte wurde ausgebaut und in einem anderen Rechner überprüft, war jedoch Fehlerfrei. Daher wurde sie wieder eingebaut und im Raidcontroller Setup wieder online geschaltet. Während des Prüfvorgangs etc. wurde der Hostrechner des öfteren herauf und wieder heruntergefahren. Dabei wurden auch die virtualisierten Systeme mitgestartet und wieder beendet. (Sie waren so konfiguriert, dass der Hostrechner erst beendet wird, wenn die Systeme heruntergefahren wurden) Nun wollte ich die virtuellen Server wieder in betrieb nehmen und sehe, dass bei beiden beim ersten "offiziellen" Startversuch Checkdisk läuft und fleißig Korrekturen durchführt. Nach Ablauf von Checkdisk brach bei beiden Servern der Startvorgang mit einem Bluescreen ab (0x000000f4, 0x00000021).
Anschließend fiel dann die vorher geprüfte Festplatte tatsächlich aus (klackert jetzt nur noch)

3. Was bereits unternommen wurde
  • Beide Server sind nicht mehr zu starten. Datenverlust liegt KEINER vor. Die vhds können gemountet und geöffnet werden, alles scheint normal. Weitere Versuche Checkdisk auszuführen brachten keinen Erfolg. Auch das Ausführen von "sources\recovery\startrep.exe" über die Windows Server 2008 DVD brachte kein neues Ergebnis. "Startrep.exe" behauptete zwar 3 mal, dass der Startvorgang nun repariert wurde, jedoch war dies nicht der Fall. Mittlerweile kommt nach "startrep.exe" nur noch eine Meldung, dass der Startvorgang nicht repariert werden konnte. Ein Backup das wiederhergestellt werden könnte existiert nicht (jaja, ich weiß.....)

Nun ist meine Frage natürlich, wie kann ich weiter vorgehen um die System wieder zum starten zu bewegen ? Eine Option wie bei Windows XP früher, welche die Systemdateien von der DVD neu kopiert hat gibt es ja nicht mehr.
Vielen vielen Dank schon mal für eure Hilfe.

Gruß,
Ludwig


EDIT: Screenshots von den Bluescreens:
748b8507d50e3be9a807142ead461c1d
5e374150b60fd0813a5b0342d031af0b

Content-Key: 176645

Url: https://administrator.de/contentid/176645

Printed on: April 19, 2024 at 05:04 o'clock

Member: Arsimael.Inshan
Arsimael.Inshan Nov 22, 2011 at 16:01:35 (UTC)
Goto Top
Hm klingt nach VF: Viel Fummlarbeit

Ich würde erstmal so vorgehen:
1.) Installiere eine neue VM mit windows 2008 R2. Stelle die VM genau so ein wie die defekte.
2.) Hänge die "defekte" VHD in die neue VM
3.) Prüfe nun die "defekte" VHD mit dem neuen Server komplett durch, und prüfe ob die 100MB Bootpartition auf der "defekten" VHD als aktiv geschaltet ist (diskpart).
4.) tausche nun "laufende" vhd gegen "defekte" vhd aus.

Läufts wieder?
Member: Lochkartenstanzer
Lochkartenstanzer Nov 22, 2011 at 16:13:57 (UTC)
Goto Top
Zitat von @vip3234:
Noch ein Tipp:

Während des Prüfvorgangs etc. wurde der Hostrechner des öfteren herauf und wieder heruntergefahren. Dabei wurden

Das sollte man tunlichst lassen. Insbesondere der Prüfvorgang, bzw die Synchronisation wird bein Neustart meist wieder frisch angestoßen, so daß es zu unötigen Verzögerungen führt.

lks
Member: vip3234
vip3234 Nov 22, 2011 at 16:29:15 (UTC)
Goto Top
Ja, VF, so sehe ich das auch.

Also was meinst du mit "Stelle die VM genauso ein wie die defekte" ? Meinst du lediglich die Hardwarekonfiguration etc. oder meinst du das auch die Win2k8R2 Installation ?

Grundsätzlich habe ich bereits eine VM mit gleicher Hardwarekonfiguration eingerichtet um die VHD dort zu prüfen und dabei eben herausgefunden, dass soweit alle Daten etc. vorhanden sind. Die Bootpartition habe ich nicht geprüft ob diese aktiv geschaltet war. Wieso sollte sich das geändert haben ?
Member: Arsimael.Inshan
Arsimael.Inshan Nov 22, 2011 at 17:48:19 (UTC)
Goto Top
Ich hab schon Pferde kotzen sehen.... Schau einfach mal nach, und stell sie wenn icht schon geschehen auf "aktiv"

BTW: bei den Fehlern 0x0000000f4 und 0x00000021 Was für Meldungen bringt er dir da? KERNEL_DATA_INPAGE_ERROR und QUOTA_UNDERFLOW?
Member: Phalanx82
Phalanx82 Nov 23, 2011 at 08:16:26 (UTC)
Goto Top
Und nochn Tipp von mir:

Wenn der Raid Controller die Platte raus wirft, hat das idR. einen Grund (wenn nich Firmwarebug, gabs mal bei WD Platten).

So eine Platte würde Ich persönlich nicht mehr in ein Raid einbauen, schon garnicht in eines mit einer Fault Tolerance von 1 Platte
wie ein Raid10.

Und hier stellt sich mir gleich die Frage: Warum keine Hotspare am Start? Sind dir deine Daten nicht wichtig? Kannst du mit einem
Totalverlust leben? :X


Mfg.
Member: vip3234
vip3234 Nov 23, 2011 at 09:31:21 (UTC)
Goto Top
Danke dir, hinterher ist man immer schlauer.
Nur nochdem wie gesagt die Platte nach dem Prüfen an einem anderen Rechner keine Auffälligkeiten gezeigt hatte war anzunehmen, dass die vom Raidcontroller gemeldeten Lesefehler nur ein Zufall oder sonst was waren.

Hotspare gab es deshalb nicht, weil es sehr unwahrscheinlich ist, dass 2 Platten innerhalb von so kurzer Zeit ausfallen, dass die eine nicht bereits regulär ersetzt wurde. Aber sicher du hast auch hier recht, man sollte sich eine Hotspare Platte leisten.

Glücklicherweise sind die Festplatten ja gerade billig nur 120% teurer, deshalb ist das gerade passend face-smile
Member: vip3234
vip3234 Nov 23, 2011 at 09:33:51 (UTC)
Goto Top
Es ist so, im Moment bin ich bis Mitte Dezember unterwegs und kann nicht an das System, daher kann ich dir die genau Meldung nicht sagen. Sobald ich wieder vorort bin gibts mehr infos.

Daher vielen Dank erst mal, melde mich dann wenn es neues gibt.
Member: vip3234
vip3234 Dec 11, 2011 at 23:15:04 (UTC)
Goto Top
So, jetzt bin ich wieder vorort am Gerät. Habe deine Anweisungen befolgt. Der Server1 bringt jetzt "c000021a Fatal Error" als Bluescreen, Server2 weiterhin 0x000000f4.
Die Bootpartition war bei beiden VHDs bereits aktiv gesetzt, eine Datenträgerüberprüfung ergab keinerlei Fehler. Die defekten Festplatten das Raids wurden ebenfalls ersetzt und der Status des Raids ist jetzt wieder optimal (Rebuild abgeschlossen).
Member: goscho
goscho Dec 12, 2011 at 07:40:59 (UTC)
Goto Top
Zitat von @vip3234:
So, jetzt bin ich wieder vorort am Gerät.
Morgen,
Na, wenn das System 3 Wochen ohne Fehlerbehebung auskam, kann es ja nicht so tragisch gewesen sein, oder hast du uns vergessen, was mitzuteilen?
Member: vip3234
vip3234 Dec 12, 2011 at 07:52:05 (UTC)
Goto Top
Naja, ich hatte vor meiner Reise ein schnelles Notfallsystem aufgebaut, das in der Zeit die notwendigen Funktionen übernommen hat.. Aber nun sollte das schon behoben werden.

Spielt das jetzt eine Rolle wie tragisch es ist ? Es muss behoben werden punkt um.
face-wink
Member: goscho
goscho Dec 12, 2011 at 08:39:22 (UTC)
Goto Top
Zitat von @vip3234:
Naja, ich hatte vor meiner Reise ein schnelles Notfallsystem aufgebaut, das in der Zeit die notwendigen Funktionen übernommen
hat.. Aber nun sollte das schon behoben werden.
Davon hast du nichts geschrieben. face-sad
Wie sieht das aus?
Hast du dazu ein Backup wiederhergestellt?
Spielt das jetzt eine Rolle wie tragisch es ist ? Es muss behoben werden punkt um.
Nein, aber es spielt schon eine Rolle, was wiederhergestellt werden muss.
Ich kann mir beim besten Willen nicht vorstellen, dass eine Firma 3 Wochen auf Ihr Netzwerk mit DC und Exchange verzichten kann.

Wie sollen wir dir jetzt helfen, das System wieder zum Laufen zu bekommen, wenn zwischenzeitlich mit (was auch immer dein Notfallsystem war) weitergearbeitet wurde?
Member: Lochkartenstanzer
Lochkartenstanzer Dec 12, 2011 at 10:55:47 (UTC)
Goto Top
Nunja, eine Platte und das Filesystem können zwar in ordnung sein, das schützt einen aber nicht davor, daß die Daten selbst inkonsistent sein können. Wenn es dabnn eine wichtige datei trifft, startet dann halt das OS nicht mehr.

Nachdem es seit W2K8/Windows6 keine echte Reparaturinstallation mehr gibt, kann man nicht wie bei W2k3/Windows5.1 einfach mal eine Reparaturinstallation drüberbügeln.

Von daher wäre das Zeitsparendste einfach die Backups von den VHDs einzuspielen und dann die aktuelleren Daten von den "kaputten" vhds auf die wiedereingespielten Backups zu kopieren. Danach kannst du, ewnn es dich immer noch interessiert, in aller ruhe die kaputten vhds inspizieren.

Du hast doch Backups von den vhds, oder?

lks
Member: Arsimael.Inshan
Arsimael.Inshan Dec 12, 2011 at 12:43:34 (UTC)
Goto Top
Zitat von @vip3234:

Hotspare gab es deshalb nicht, weil es sehr unwahrscheinlich ist, dass 2 Platten innerhalb von so kurzer Zeit ausfallen, dass die
eine nicht bereits regulär ersetzt wurde. Aber sicher du hast auch hier recht, man sollte sich eine Hotspare Platte leisten.

Also ich kenn das andersrum: eine platte fällt aus und beim Rebuild gibt dann die nächste wegen der gestiegenen beanspruchung den geist auf und die nächste und die nächste......
Member: Lochkartenstanzer
Lochkartenstanzer Dec 12, 2011 at 13:00:26 (UTC)
Goto Top
Zitat von @vip3234:
Hotspare gab es deshalb nicht, weil es sehr unwahrscheinlich ist, dass 2 Platten innerhalb von so kurzer Zeit ausfallen, dass die
eine nicht bereits regulär ersetzt wurde. Aber sicher du hast auch hier recht, man sollte sich eine Hotspare Platte leisten.

Ich beobachte sehr oft, daß ein RAID mit mehreren baugleichen Platten bestückt wird. Wenn die nun einen "Serienfehler" haben, ist es durchaus sehr wahrscheinlich, daß die alle nach kurzer Zeit hintereinander ausfallen. Habe ich sogar schon beobachtet. Von daher ist ein hot-spare eine sehr sinnvolle Investition. Und man sollte natürlich auch eventuell mindestens 2 oder 3 verschiedene Modelle/Hersteller verwenden. Das kann natürlich auch nach hinten losgehen, weil das wiederum die Wahrscheinlichkeit erhöht, daß da wiederum ein herstelelr dabei ist, der nicht so sorgfältig wie die anderen arbeitet und daher eine Platte ggf auf jeden Fall vorzeitig über den Jordan geht.

Aber was wäre das Leben ohne Risiko? face-smile

lks
Member: vip3234
vip3234 Dec 12, 2011 at 13:59:42 (UTC)
Goto Top
Ein verwendbares Backup von diesem System exisitiert nicht. Ein Backup gibt es lediglich von den Nutzerdaten. Daher habe ich ein komplett neues System aufgesetzt, dass in meiner Abwesenheit den E-Mail Verkehr etc. aufrechterhalten hat.

Was jetzt der ideal Fall wäre, wäre wenn die beiden virtuellen Server wieder zum starten zu bewegen wären. Dann würde ich lediglich die neuen Nutzerdaten vom Notfallsystem den alten hinzufügen und fertig.
Aber wie es aussieht wird es damit wohl nichts, aus diesem Grund werde ich zwei komplett neue Systeme aufsetzen, die und die alten sowie die neuen Nutzerdaten migrieren.

Danke für eure Hilfe, ich bin für alle Vorschläge dankbar.