anaxagoras83
Goto Top

Terminalserver auf Hyper-V friert ein

Hallo alle zusammen,

ich stehe seit einiger Zeit vor einem Problem, das ich nicht erkennen bzw. erfassen kann. Ein Terminalserver in einer Hyper-V virtualisierten Windows Server 2008R2 Umgebung hängt sich zu unbestimmten Zeiten immer wieder auf. Er friert ein, sodass ich auf der Hyper-V Konsole der virtuellen Maschine nur den Lock-Screen sehe aber nicht mehr interagieren kann.

Alles was ich tun kann ist den Server zu stoppen und neu zu starten. Bisher ist das mind. 30-40 mal passiert. Es ist außer den gerade geöffneten und nicht gespeicherten Änderungen kein Datenverlust zu verzeichnen, jedoch wächst das Misstrauen der Maschine gegenüber täglich.

Das Ereignislog auf der virtuellen Maschine und dem Terminalserver zeichnet keine erkennbaren Fehler, Warnungen oder anderweitige Informationen auf, die auf einen Ausfall hinweisen.

Hier die Details zur Umgebung:

HyperVisor:

Windows Server 2012 (40GB RAM / 2x E5620 / 2x RAID5)
- Hyper-V Rolle installiert
- Es laufen 4 virtuelle Maschinen
(1) AD,DC,DNS,DHCP,Virenschutz-Verwaltung,TS-Lizenzserver
(2) Fileserver, Printserver, MS-SQL-Server
(3) Exchange Server 2010, Virenschutz GW
(4) Terminalserver

- Der Terminalserver (Windows 2008R2) ist auf dem aktuellen Patch-Stand.
- Es sind 14GB Arbeitsspeicher zugeweisen
- Es sind 4 Kerne zugewiesen
- Es sind noch ca. 50 GB von 200 GB der virtuellen HDD frei
- Es arbeiten 5 Leute aktiv und primär auf dem Terminalserver
- Zum Zeitpunkt des Ausfalles liegt die CPU-Last zwischen 5 und 25 %

Was ich bisher gemacht habe:
- Aktualisierung des VHosts und des virtuellen Servers (Windows-Updates + Third-Party-Anwendungen)
- Überprüfung und Reparatur des Dateisystems auf Hyper-V und virtueller Maschine
- Bluescreenview auf der virtuellen Maschine spuckt mir keine Bluescreens aus
- Nach Ausfällen - erstellen einer benutzerdefinierten Protokollierungsansicht auf virtuellen Server und Hyper-V
-- Es wird nur der Einschaltprozess geloggt. Auf dem virtuellen Server zeigt er keine Warnungen oder Fehler an nur Informationen zu gestarteten Tasks
- Löschen aller nicht verwendeter Tasks in der Aufgabenplanung auf dem Terminalserver
- Erneuerung der Integrationsdienste auf der virtuellen Maschine
- Änderung der Zuweisung von RAM (mehr und weniger Arbeitsspeicher für die virtuelle Maschine brachten keine Veränderungen)
- Der Server ist auch bereits nachts ausgefallen, wenn niemand auf der Maschine angemeldet war.

Da ich keinen Punkt habe an dem ich ansetzen kann bitte ich euch um Rat wie ich dem Problem näher kommen kann um zu verstehen was den Ausfall auslöst und wie ich ihn ggf. beheben kann.

Beste Grüße
und bereits vielen Dank für die eingesetzte Zeit zum lesen und ggf. antworten

Content-Key: 335703

Url: https://administrator.de/contentid/335703

Printed on: April 23, 2024 at 09:04 o'clock

Member: ukulele-7
ukulele-7 Apr 21, 2017 at 10:16:30 (UTC)
Goto Top
Ohne einen konkreten Verdacht zu haben hier drei Ideen:

a) Wie ist die virutelle HDD physisch umgesetzt, eine SAN oder lokaler Speicher? Ist die Integrität des Speichers sichergestellt oder können hier Hardwarefehler unbemerkt bleiben?
b) Frieren noch andere VMs auf dem Host ein oder nur diese?
c) Was passiert mit den User-Sitzungen wenn der Server einfriert, laufen die weiter?
Member: anaxagoras83
anaxagoras83 Apr 21, 2017 at 10:57:11 (UTC)
Goto Top
Hallo ukulele-7,

vielen Dank für die schnelle Antwort:
a) die virtuellen Platten liegen auf einem lokalen Speicher (RAID5) im lokalen Dateisystem des Hyper-V Servers
Das RAID hatte tatsächlich gestern eine Platte angezeigt die ausgefallen ist, diese wurde jedoch gewechselt und der RAID-Status steht wieder auf "optimal" - Die Ausfälle sind jedoch schon weit vor dem Ausfall der Platte aufgetreten und auch nach dem Tausch hatten wir heute wieder einen Ausfall(einfrieren) zu verzeichnen.
b) Es ist bisher erst einmal der Exchange-Server eingefroren, das liegt jedoch schon ein paar Monate zurück. Die Frequenz des Einfrierens des Terminalservers variiert zwischen einmal in der Woche und einmal am Tag.
c) Die User-Sitzungen frieren ebenfalls ein

Beste Grüße
anaxagoras
Member: ukulele-7
ukulele-7 Apr 21, 2017 at 11:40:01 (UTC)
Goto Top
Also das mit dem RAID Controller würde ich schon genauer untersuchen, das muss kein Zufall sein. Gut wäre es, ließen sich die SMART Werte und / oder die Logs des Raidcontrollers einsehen. Es könnte z.B. sein das eine Systemdatei von Windows nicht gelesen werden kann und der Versuch provoziert den Fehler.

Allgemein würde ich einen Hardwaredefekt als warscheinlich ansehen. Hat der Server ECC RAM? Über welche Hardware und wie alt reden wir hier? Hast du die Möglichkeit die VM auf einen anderen Host umzuziehen? Dann könntest du sehr einfach die Hardware ausschließen.
Member: anaxagoras83
anaxagoras83 Apr 21, 2017 at 12:58:08 (UTC)
Goto Top
Hallo nochmal,

die SMART Werte der Einzelplatten und die Konsistenz des RAIDs wird über die Herstellertools geregelt und sind aktuell in Ordnung.
Es ist ein IBM-X-Server ca. 5 Jahre alt. Es sind 40GB ECC-RAM eingebaut.

Die anderen Maschinen auf dem gleichen Host sind wie gesagt nicht von diesen Ausfällen betroffen.
Member: ukulele-7
ukulele-7 Apr 24, 2017 at 06:43:11 (UTC)
Goto Top
Zitat von @anaxagoras83:

Die anderen Maschinen auf dem gleichen Host sind wie gesagt nicht von diesen Ausfällen betroffen.
Könnte wie gesagt daran liegen das der Zugriff auf einen ganz bestimmten Berreich der (virtuellen) Festplatte das Problem auslöst, ist aber nur ein Gedanke. Am leichtesten ließe sich die Hardware ausschließen in dem du den vServer auf einen anderen Host verschiebst, hast du einen weiteren Host?
Member: LauneBaer
LauneBaer Apr 24, 2017 updated at 08:40:27 (UTC)
Goto Top
Hallo,

wie sind denn die restlichen Ressourcen (CPU, RAM) auf die anderen VM's aufgeteilt?

Viele Grüße
Member: anaxagoras83
anaxagoras83 Apr 27, 2017 at 15:05:45 (UTC)
Goto Top
Hallo Ukulele,

einen weiteren V-Host haben wir leider nicht zur Verfügung aber wir werden die virtuelle Maschine auf ein anderes RAID im gleichen Server legen um einen Hardware-Festplatten/RAID bezogenen defekt auszuschließen. Ich gebe darüber dann Rückmeldung, falls der Ausfall auf dem separaten RAID ebenfalls stattfindet.
Member: anaxagoras83
anaxagoras83 Apr 27, 2017 at 15:17:48 (UTC)
Goto Top
Hallo LauneBaer,

DC = 1 Core, 2 GB RAM
FS = 1 Core, 6 GB RAM
EXCH = 2 Cores, 6 GB RAM
RDS = 4 Cores, 14 GB RAM
Linux = 1 Core, 4 GB RAM

Beste Güße
Member: LauneBaer
LauneBaer Apr 28, 2017 at 11:56:10 (UTC)
Goto Top
Hi,

also lt. MS will alleine der Exchange schon minimum 8GB haben. (bzw. hier gilt wie beim SQL, viel hilft viel)
Auf deinem Fileserver läuft ja auch der SQL noch mit, was treibt der denn so? Wie sehen die Zugriffe darauf aus? Der kommt mir schon ziemlich undersized vor mit nur 1 Core und 6GB RAM.

Sprich mit Exchange und SQL hast du schon mal 2 VM's die RAM nur so fressen. Ich würde deinem Host und dann deinen VM's mehr RAM spendieren und schauen ob sich das Problem damit löst.

Viele Grüße
Member: anaxagoras83
anaxagoras83 May 09, 2017 at 07:39:43 (UTC)
Goto Top
Hey LauneBaer,

du hast natürlich recht was die Verteilung angeht und dass die Maschinen (gerade der FS mehr Power bräuchte). Der SQL-Server wird für das Buchhaltungsprogramm verwendet und es ist keine hohe Last auf der Maschine) diese Konfiguration ist nun auch einige Jahre lang gelaufen.

Trotzdem erklärt für mich eine höhere Last auf den anderen Maschinen nicht das einfrieren der kompletten VM auch zu den Zeitpunkten wenn niemand auf dem System arbeitet.

Beste Grüße