pingolem
Goto Top

Bluescreens in meiner Terminalserverumgebung

Hallo Allerseits,

ich betreibe bei meinem Arbeitgeber eine Serverfarm, die im wesentlichen aus folgenden Servern besteht:

- zwei Domänencontrollern mit Windows Server 2008 R2 Std. SP1 auf Proliant DL 380 G7

- zehn Terminalserver mit Windows 2003 R2 STD SP2 auf fünf Proliant DL 380 G6 mit XenServer 5.5 virtualisiert

Seit dem 15.3. bekomme ich in unregelmäßigen Abständen auf den Terminalservern Bluescreens. Die Fehlermeldung, sowie die Zeitpunkte der aufgetretenen Fehler, könnt Ihr dem beigefügten Bild entnehmen.

d342e1874fdd68f13661b3c287079f6a

Wie dort zu sehen ist, stürzen die Server immer Nachmittags, gegen Feierabend, ab.

Die Benutzer (ca. 115 Gleichzeitige) sind übrigens per Ica Client mit Igel UD-2-420-LX Thin Clients mit den Terminalservern verbunden.

Bis auf den angezeigten Fehler gibt die Ereignissanzeige leider keine Informationen über die Abstürze her.

Windows Updates hatte ich zwar installiert, ich hatte diese aber natürlich erstmal auf zwei virtuellen Maschinen getestet. Nachdem Sie einige Tage liefen, habe ich sie auch auf den restlichen Maschinen installiert.

Die Internetsuche hat auf defekten Speicher, oder einen anderen Hardwarekonflikt hingedeutet. Kann ich mir aber nicht wirklich vorstellen, da die Probleme auf allen Servern nahezu gleichzeitig abgefangen haben.

Bin für jeden Tipp zu haben. FAlls Ihr noch mehr Infos braucht, könnt Ihr mich gerne ausfragen.

LG

Pingolem

Content-Key: 182766

Url: https://administrator.de/contentid/182766

Printed on: April 20, 2024 at 09:04 o'clock

Member: mak-xxl
mak-xxl Mar 29, 2012 at 06:13:26 (UTC)
Goto Top
Moin Pingolem,

was sagen die USV-Logs? Neue, große Maschinen, Klimageräte, GLT im Umfeld dazugekommen? Evtl. Netzkontrolle auf Spikes, heftige Transienten o.ä.

Freundliche Grüße von der Insel - Mario
Member: Steve2388
Steve2388 Mar 29, 2012 at 06:23:25 (UTC)
Goto Top
Sind die TS virtualisiert. Wenn ja kommt ein Hardware-Defekt auf dem Host in Frage.
Member: Pingolem
Pingolem Mar 29, 2012 at 06:31:04 (UTC)
Goto Top
Ja sind sie, aber auf fünf physischen Maschinen. Ist wohl eher unwahrscheinlich, dass alle fünf auf einmal einen Hardwaredefekt haben.
Member: jens2001
jens2001 Mar 29, 2012 at 06:39:06 (UTC)
Goto Top
Moin,

bei solch einem Bild fällt mir als erstes die Temperatur als Grund ein.
Hast du eine Temperaturüberwachung im Serverraum. Hast du physischen Zugang zu den Servern.
Der 15.3. ist auch der Tag an dem es hier in Norddeutschland zum ersten mal richtig warm wurde.
Member: Pingolem
Pingolem Mar 29, 2012 at 06:47:43 (UTC)
Goto Top
Die USV-Logs sind unauffällig. Es ist auch nichts besonderes an Harware neu dazu gekommen. Spikes und Transienten? Kenn ich nicht, klingt aber nach Strom face-wink

Ist aber nur so, dass die virtuellen Maschinen nach einer Bluescreen neu starten. Nie zwei zusammen, die auf einem physischen Server laufen.
Member: Pingolem
Pingolem Mar 29, 2012 at 06:50:08 (UTC)
Goto Top
Die Temperatur wird duch ein Termometer (wandbefestigung) überwacht face-wink

Aber mal im ernst, die Temperatur wird nicht automatisiert überwacht, ich sitze aber direkt im Raum nebenan und bin regelmäßig im Serverraum. Da sinds nie mehr als 22 Grad.
Member: jsysde
jsysde Mar 29, 2012 at 07:27:34 (UTC)
Goto Top
Moin,

ich virtualisiere zwar (mittlerweile) per Hyper-V, aber sollte es nicht auch für alle anderen Hypervisor-Systeme sowas wie "Integrationstools" geben, also Treiber, die in die VMs installiert werden müssen, damit deren Kommunikation mit dem Host korrekt funktioniert?

Kann mich an Probleme mit den VMWare-Tools erinnern, die nicht aktualisiert wurden. Da knallte es dann auch kurze Zeit nach nem Patchday....

Cheers,
jsysde
Member: Pingolem
Pingolem Mar 29, 2012 at 07:30:36 (UTC)
Goto Top
Hatte ich auch schon drüber nachgedacht. Ich habe dann zumindest auch das aktuelle Servicepack von Citrix für den XenServer installiert in der Hoffnung, dass die entsprechenden Treiber aktualisiert werden. Ist aber auch nur ein stochern im Nebel gewesen, hat jedenfalls nichts gebracht.
Member: AndiEoh
AndiEoh Mar 29, 2012 at 09:14:58 (UTC)
Goto Top
Hallo

Also im Normalfall würde ich auch auf Hardware (RAM etc.) vermuten. Da allerdings alle Maschinen gleichzeitig betroffen sind jedoch nicht mehrere VM Instanzen auf einer Hardware müssten es Komponenten sein die von allen benutzt aber nicht immer gleichzeitig verwendet werden. Wie sieht es mit den Dateisystemens aus? NAS/SAN oder lokale Arrays?

Falls es ein Software Problem ist müsste es den Kernel Modus innerhalb der VMs betreffen, d.h. irgend eine Komponente im Ring 0 hat sich geändert. Sind die TS paravirtualisiert bzw. arbeiten sie mit Xen Treibern? Soweit ich mich erinnere war vor kurzem eine MS-Patch dabei der ein (Sicherheits-)Problem mit dem laden von Kernel Treibern behoben hat.

Gruß

Andi
Member: Pingolem
Pingolem Mar 29, 2012 at 10:52:49 (UTC)
Goto Top
Es handelt sich ausschließlich um lokale Arrays. Wie erkenne ich, ob eine virtuelle Maschine paravirtualisiert ist? Ich habe die Terminalserver nämlich nicht selber aufgesetzt.
Member: AndiEoh
AndiEoh Mar 29, 2012 at 12:07:33 (UTC)
Goto Top
Wir haben kein Xen deshalb kann ich dir keine 100% Antwort geben. Allerdings wird es üblicherweise so erledigt das die Netzwerk/Grafik/IO Treiber spezielle Xen Treiber sind und nicht für irgendwelche generische Hardware die das OS mitbringt. Teilweise wird auch der Kernel durch Module modifiziert, betrifft aber meine ich nur Linux.

Mit lokalen Arrays dürfte auch die letzte Hardware Gemeinsamkeit ausfallen, also auf in den Ring 0 der TS...
Member: Pingolem
Pingolem Mar 29, 2012 at 12:47:16 (UTC)
Goto Top
Klingt, als ob es meine Fähigkeiten übersteigen würde. Werde morgen aber mal google bemühen. Danke!
Member: AndiEoh
AndiEoh Apr 04, 2012 at 11:23:23 (UTC)
Goto Top
Hallo

Einfach mal im Gerätemanager der TS nachschauen was als Hardware/Hersteller der Grafikkarte, des IO-Systems und der Netzwerkkarte angegeben wird. Wenn dort irgendwas mit Citrix/Xen steht gibt es einen Verdächtigen --> Nachfragen ob es eine Treiberupdate gibt bzw. Knowledgebase von Citrix/Xen aufsuchen.
Auf jeden Fall wäre eine Rückmeldung sinnvoll wenn du das Problem gefunden hast.

Gruß

Andi
Member: Pingolem
Pingolem Apr 10, 2012 at 07:36:21 (UTC)
Goto Top
Hi!

Ich war ein paar Tage nicht im Büro, deshalb kommt die Antwort ein wenig später.

Die Grafikkarte läuft mit einem Cirrus Logic Treiber. Die Netzwerkkarte und der Raid Controller laufen jedoch über Citrix Treiber.

Ich werde mal schauen, ob es für die zwei aktuellere Treiber gibt ...