stephanbahr
Goto Top

ESXI 5 Host, Windows Server 2012R2 Gast, BlueScreens

Guten Tag werte Kollegen,

ich verzweifle hier gerade und hoffe, jemand hat vielleicht einen Hinweis für mich.

Wir haben einen Server mit folgenden Komponenten gebaut:

- ASUS KGPE-D16 Mainboard
- AMD Opteron 16-Core 2,1 GHz Prozessor
- 4x 8 GByte DDR3 ECC Reg. Ram
- LSI MegaRaid 9266-8i RAID-Controller
daran:
- 6x Crucial M500 240 GB SSD im RAID10
- 2x WD 1 TB HDD im RAID1

Als Hypervisor kommt VMware ESXi 5 zum Einsatz. Erst hatte ich 5.0 U3, jetzt 5.1 U2 installiert, virtuelle Hardware und VMware Tools auf v9 aktualisiert Problem bleibt jedoch das selbe:

Ich habe vier virtuelle Server 2012 R2 auf dem ESXi Host laufen:

SRV01 - Active Directory, Exchange 2013, File- und Printserver
SRV02 - Sonderanwendung
SRV03 - Sonderanwendung
SRV04 - Terminalserver, bei der Anmeldung werden per Netlogon Netzlaufwerke und Drucker verbunden

Und genau letzterer ist mein Sorgenkind. Das Ding stürzt am laufenden Band mit Bluescreens ab. hier die Ausbeute der letzten 14 Tage:

Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x0000003b (0x00000000c0000005, 0xfffff8027aeb004b, 0xffffd0002374dee0, 0x0000000000000000). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030414-10578-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x0000000001bfb160, 0xfffff80063d470f0). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030414-10843-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x0000001a (0x0000000000041287, 0x0000000000545854, 0x0000000000000000, 0x0000000000000000). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030414-20937-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000d1 (0x00000036500a1017, 0x0000000000000002, 0x0000000000000000, 0xfffff8000082974a). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030314-9843-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x0000000004040017, 0xffffe00003af6600). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: .
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x0000000000040002, 0xffffe0000228a360). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030114-26015-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x000000000c040015, 0xffffe00003a5a5c0). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: .
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x00000019 (0x0000000000000020, 0xfffff803c314c0e0, 0xfffff803c314cdb0, 0x0000000005cd4770). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 022714-25203-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x0000003b (0x00000000c0000005, 0xfffff80245cbb740, 0xffffd00021d50b00, 0x0000000000000000). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 022614-22703-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x0000000004040013, 0xffffe000056ff470). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 022514-20312-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x000000000404000c, 0xffffe00003cdb450). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 022114-18375-01.
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c2 (0x0000000000000007, 0x0000000000001205, 0x0000000004040005, 0xffffe00001f4b1a0). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: .

Für sachdienliche Hinweise bin ich äußerst dankbar!

Content-Key: 231614

Url: https://administrator.de/contentid/231614

Printed on: April 19, 2024 at 00:04 o'clock

Member: emeriks
emeriks Mar 04, 2014 at 14:12:16 (UTC)
Goto Top
Als erstes solltest Du mal rausbekommen, was genau für ein Fehler im Bluescreen angezeigt wird. z.B. in dem Du den automatischen Boot bei Fehler ausschaltest und Dir dann in Ruhe die Ausgabe ansehen kannst/ danach gogglen kannst.

E.
Member: StephanBahr
StephanBahr Mar 04, 2014 at 14:20:15 (UTC)
Goto Top
Danke emeriks für die schnelle Rückmeldung. Die Fehler im Bluescreen entsprechen den o.g. Fehlern aus dem Ereignisprotokoll. Also:

0x0000003b = SYSTEM_SERVICE_EXCEPTION
0x000000c2 = BAD_POOL_CALLER
0x0000001a = MEMORY_MANAGEMENT
0x000000d1 = DRIVER_IRQL_NOT_LESS_OR_EQUAL
0x00000019 = BAD_POOL_HEADER
Member: Dani
Dani Mar 04, 2014 at 17:44:23 (UTC)
Goto Top
Moin,
also bei ESXi 5.0u3 gilt dieser Eintrag der KB.


Grüße,
Dani
Member: StephanBahr
StephanBahr Mar 04, 2014 at 17:51:31 (UTC)
Goto Top
Danke für das Feedback, Dani. Leider (oder glücklicherweise) ist CRITICAL_STRUCTURE_CORRUPTION einer der wenigen Fehler, die bei mir nicht aufgetreten sind (siehe Liste oben). Dazu kommt, dass der verlinkte Fehler in 5.0 U3 "resolved", also gelöst ist. Hätte also auch in meiner Ausgangssituation nicht auftreten dürfen. Und unter 5.1 U2 dann erst recht nicht.
Member: Dani
Dani Mar 04, 2014 at 18:00:59 (UTC)
Goto Top
Hmm... nutzt du als Netzwerktreiber Intel E1000 oder vmxnet3?


Grüße,
Dani
Member: StephanBahr
StephanBahr Mar 04, 2014 at 18:03:48 (UTC)
Goto Top
vmxnet3
Member: DerWoWusste
DerWoWusste Mar 04, 2014 updated at 21:07:36 (UTC)
Goto Top
Ich kann nur berichten, dass vmware "meint" 2012 R2 und win8.1 zu unterstützen. Leider sieht die Praxis anders aus: auf unserem 5.5er kam nach ein paar Tagen problemlosem Betrieb von einer 8.1er VM plötzlich ein Server (Host!-) Absturz. Nach erneutem Hochfahren lief der Server so lange, bis die 8.1er VM startete, dann dauerte es keine 2 Minuten, dann erneut Hostcrash. Reproduzierbar. Ohne die 8.1er seit Wochen kein Problem.
Bis auf Weiteres kein 8.1/2012R2 auf ESXI für mich.
Member: Dani
Dani Mar 04, 2014 updated at 21:24:19 (UTC)
Goto Top
Moin StephanBahr,
hätte... ist ein schönes Wort. Kontrollier bitte die Einstellungen wie im Artikel genannt.
Wir haben Server 2012R2 auf 5.1U2 problemlos im Einsatz.

Ansonsten schau hier noch nach bezüglich deiner VM Hardwareeinstellungen.

@DerWoWusste
Hat dir noch keiner gesagt, dass man bei VMWare auf jeden auf Update 1 warten soll? face-smile


Grüße,
Dani
Member: DerWoWusste
DerWoWusste Mar 04, 2014 at 21:39:59 (UTC)
Goto Top
Hat dir noch keiner gesagt, dass man bei VMWare auf jeden auf Update 1 warten soll?
Wir haben 8.1 seit Wochen benutzt (vorher behutsam getestet). Keinerlei Probleme. Von einer Sekunde auf die nächste BÄMM. War sehr sonderbar.
Member: obliterator
obliterator Mar 05, 2014 at 07:31:48 (UTC)
Goto Top
Wir haben ESXi 5.5 im Einsatz. Mit einen Windows Server 2012 R2 als Terminalsserver. Bis jetzt ohne Probleme
Member: StephanBahr
StephanBahr Mar 06, 2014 at 09:52:48 (UTC)
Goto Top
Soeben ist nach 2 Tagen fehlerfreiem Betrieb wieder ein Fehler aufgetreten:

Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x0000001a (0x0000000000041287, 0x0000000000fe0000, 0x0000000000000000, 0x0000000000000000). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 030614-38671-01.

Wieder MEMORY_MANAGEMENT.

Hat noch jemand konstruktive Ideen?
Member: Dani
Dani Mar 06, 2014 at 10:20:05 (UTC)
Goto Top
Moin,
ist deine Hardware HCL konform?


Grüße,
Dani
Member: StephanBahr
StephanBahr Mar 06, 2014 at 11:41:37 (UTC)
Goto Top
Das Mainboard ist nicht explizit aufgeführt, sonst ist alles im grünen Bereich.

Vielleicht stelle ich auch einfach die falschen Fragen. face-smile

Nehmen wir mal an, dass der ECC Registered RAM einen Fehler hat (wobei er das meinem Verständnis nach doch handhaben können sollte), ist es dann wahrscheinlich, dass nur das Gastsystem betroffen ist und nicht der Host? Denn die anderen 2012 R2 Gäste auf dem Host (und auf einem 100% baugleichen Host bei einem anderen Kunden) laufen ja störungsfrei.
Member: DerWoWusste
DerWoWusste Mar 06, 2014 at 11:55:51 (UTC)
Goto Top
Nein, das ist nicht wahrscheinlich.
Ich möchte noch einmal zu meinem geschilderten Absturz und den Sonderbarkeiten kommen, die ihn umgaben: zunächst war das Windows Update auf dem Gast (win8.1) aus, wochenlang keine Probleme. Es begann mit dem Aktivieren von Windowsupdates und der ersten Suche danach ->Crash des Hosts. Da das Updating aber nach jedem Neustart des Hosts neu anläuft, crashte der Host danach jeweils kurze Zeit nachdem die 8.l1er VM hochfuhr.
Was soll man dazu noch sagen, außer, dass es nicht 100%ig kompatibel ist, selbst wenn vmware es sich so wünscht. Es mag sein, dass es mit anderen 8.1ern geht, bei uns ist das Thema zunächst ausgesetzt, bzw. die Tests auf Hyper-V verlagert.

Ich schildere das, um die Zweifel an der Kompatibilität zu untermauern.
Member: StephanBahr
StephanBahr Mar 17, 2014 at 09:40:48 (UTC)
Goto Top
So, die Suche geht weiter. Ich habe auf der CeBit mit einem Microsoft-Techniker gesprochen. Der meinte, ich solle mal in VMware den RAM fest zuweisen und die VMs mal in einer anderen Reihenfolge starten. Sollte es an einem defekten Arbeitsspeicher-Riegel liegen, ist die Wahrscheinlichkeit groß, dass es dann eine andere VM erwischt. Gesagt, getan. Leider ist es noch immer der Terminalserver, der abschmiert. Fazit: defekter RAM-Riegel ist immer unwahrscheinlicher. Eine Lösung für das Problem habe ich aber noch immer nicht.

Ich werde jetzt noch einen Windows Server 2008 R2 als zweiten Terminalserver aufsetzen und die User darauf umlotsen. Mal gucken, ob der 2012 auch ohne Benutzerinteraktion abraucht.

Sonst noch konstruktive Ideen?
Member: Dani
Dani Mar 18, 2014 at 19:42:19 (UTC)
Goto Top
Ich hätte gesagt Supportticket aufmachen und suchen lassen. Wenn die Hardware aber nicht zertifiziert ist, könnte es eng werden.
Member: StephanBahr
StephanBahr Mar 20, 2014 updated at 13:23:31 (UTC)
Goto Top
Es wird schon an der Stelle eng, wo man lediglich den kostenfreien ESXi einsetzt. face-smile