yotyot
Goto Top

Server 2008 R2 in VMware (ESX-Farm) extrem langsam

Moin!

Wir haben eine etwas größere ESX-Farm mit - und das braucht nicht hinterfragt zu werden - reichlich Leistung. Auch den VM-Maschinen ist genügend, aber nicht zu viel zugewiesen. Während fast alle Maschinen zügig am Start sind, wie man das erwartet, gibt es da einen Windows 2008 R2 Server, der mich verzweifeln lässt:

- Vom Einschalten der virtuellen Maschine bis zu dem Laufband "Windows wird gestartet" dauert es ca. 1,5 Minuten (nicht gefühlt, sondern echt)
- Bis ich mich anmelden kann, vergehen 22 bis 29 Minuten, ist immer etwas unterschiedlich
- Die Maschine ist extrem Ultra langsam. Um eine MMC aufzurufen, bleibt genügend Zeit, noch einen Kaffee zu trinken.
- Das Problem kann nicht an Windows selbst liegen, weil es bereits vor dem eigentlichen Windows-Start zu langsam ist.
- Das virtuelle BIOS fühlt sich noch normal an.

Was habe ich bisher getan?

- Natürlich hatte ich zunächst das Windows in Verdacht und dort alles aktualisiert, VMware Tools, Windows Updates, Treiber, was man so macht.
- Ich habe die virtuelle Maschine auf einen anderen ESX-Host migriert: keine Änderung
- Ich habe die virtuelle Maschine neu erstellt und die Festplatte umgehangen: keine Änderung. Info zur Leistung: Auf dem "neuen" Host laufen zur Zeit zwölf Maschinen, auf dem anderen, baugleichen laufen 92 Maschinen. Performant. Leistung ist also nicht das Problem.

Das impliziert mir jetzt, dass es an der virtuellen Festplatte selbst liegt. Aber sie läuft, sie ist nicht komplett Schrott oder so. Es gibt keinerlei Fehler, die Auslastung ist bei allen Parametern, die man so prüfen kann, sowohl in VMware als auch in Windows im Bereich "tödlich gelangweilt". Das einzige, was passiert, ist, dass die Clients immer wieder mal die Verbindung zu dem Server verlieren, keine Rückmeldung bekommen und solche Dinge.

Was kann das sein, wo kann ich noch suchen? Was wird sowohl beim Bootvorgang, also noch vor dem eigentlichen Windows-Start genauso gebraucht, wie während des Windows-Betriebs? MBR? Wenn der hin ist, dürfte doch gar nichts mehr gehen, oder?

Was übersehe ich da?

Grüße aus der Mittags"pause" face-wink

Y.

Content-Key: 319270

Url: https://administrator.de/contentid/319270

Ausgedruckt am: 19.03.2024 um 06:03 Uhr

Mitglied: falscher-sperrstatus
Lösung falscher-sperrstatus 27.10.2016 um 14:08:42 Uhr
Goto Top
Hi Y,

nun wenn die Performance passt - liegt die vDisk auf einem anderen Storage? Sind die Platten OK? Hast du die vDisk mal auf ein anderes Storage umgezogen? Was sagt der Eventlog? Was macht dieser Server genau? Welche Software/Dienste in welcher Version.

Wie sehen die Leistungsstats der VM aus?

Daneben - Backup vorhanden? Mach doch ein plain Recovery auf einem anderen System.

VG
Mitglied: sabines
sabines 27.10.2016 um 14:12:50 Uhr
Goto Top
Hi,

gibt es Unterschiede in der Konfiguration dieser VM im Vergleich zu den anderen, bspw. anderer NIC.
Welche Dienste (SQL etc) stellt der Server bereit?

Wahrscheinlich macht eine tiefere Analyse wenig Sinn und ist zeitintersiver als die Dienste auf andere Server auszulagern und dann die Kiste komplett neu aufzubauen.

Gruss
Mitglied: YotYot
YotYot 27.10.2016 um 14:26:15 Uhr
Goto Top
Hi,

es gibt eine ganze Menge vergleichbarer Server, es handelt sich hierbei um die SQL-Server für DATEV-Umgebungen. Auch der beschriebene Server war mal schnell, hat dann immer öfter sagen wir mal: zeitweise "Ausfälle" gehabt und ist jetzt dauerhaft langsam.

Aktuell in diesem Moment läuft ein Checkdisk und ich befasse mich etwas genauer mit der MFT, deren Konfiguration und den Folgen, wenn man das falsch macht. Da dieser Server nebenbei auch Fileserver ebenfalls für DATEV ist, liegen hier natürlich auch noch ein paar hunderttausend Dateien herum, DATEV ist da nicht zimperlich.

Das mit dem Auslagern und neu aufbauen ist erst für Februar geplant, das würde mir so richtig überhaupt nicht in den Kram passen, weil das nicht in zwei, drei Tagen getan ist und ich sinnloserweise zur Zeit der einzige bin, der das Ding bedienen darf. Ist unser eigener, interner Buchhaltungsserver mit Lohndaten und all so Zeug, mein zweiter Admin für diesen Server ist mir vor vier Wochen "abhanden gekommen" und es gibt noch keinen neuen face-sad

Ich schreibe später, was Checkdisk ergeben hat.

Danke fürs Mitdenken face-smile

Y.
Mitglied: ukulele-7
ukulele-7 28.10.2016 aktualisiert um 09:03:11 Uhr
Goto Top
Mir ist noch nicht ganz klar in welcher Phase dein Bootvorgang lange dauert. Du schreibst vor dem Windows Start und nach dem BIOS, bleibt der Bildschirm da schwarz? Eigentlich kommt Windows ja (zeitlich) fast unmittelbar nach dem BIOS.

Ist für die VM vielleicht eine Bootverzögerung konfiguriert oder hat HA irgendwelche speziellen Einstellungen? Vielleicht hat sich dein dahingeschiedener DATEV Admin einen Spass erlaubt face-smile
Mitglied: YotYot
YotYot 28.10.2016 um 13:03:35 Uhr
Goto Top
Moin!

ok, den Text der letzten zwei Stunden habe ich dann mal gelöscht, wir sind der Sache ein gutes Stück näher gekommen, wenn es auch noch nicht endgültig gelöst ist:

Der Windows-Server als solcher kann ausgeschlossen werden, der ist in Ordnung.

Wir haben die VM auf ein anderes SAN verschoben und siehe da: wir haben eine Beschleunigung um den Faktor 300. Ungefähr. Statt neun Minuten braucht ein bestimmtes Programm jetzt nur noch 12 bis 15 Sekunden für den Start. Eine MMC startet nicht in drei Minuten, sondern in ein paar Sekunden. Der Internet Explorer ist in einer Sekunde da, nicht erst nach zwei Minuten.

Wir sind also beim SAN, das keine Fehler ausspuckt. Für das SAN sind allerdings andere Admins zuständig, da habe ich keinen Zugriff. Ich lasse die Frage noch als offen stehen und schreibe mit hinein, was es letztlich war.

Danke für Eure Kopfschmerzen face-wink und ein schönes Wochenende!

Y.
Mitglied: YotYot
YotYot 28.10.2016 um 13:08:13 Uhr
Goto Top
@ Ukulele-7

Das mit dem Bootvorgang: ja, normalerweise Windows unmittelbar... stimmt. hier nicht.

Verzögerung: nein, das ist schleichend immer schlimmer geworden. Wir betreiben mehrere hundert VMs für Kunden und hier geht es um einen unserer eigenen Server, der aber genauso konfiguriert ist. Es ist ja auch nicht aufs booten begrenzt, sondern fängt da an und hört nicht wieder auf. Internet Explorer starten dauert dann schnell mal zwei bis drei Minuten. Gleichzeitig ist die CPU-Last bei max. 3%, RAM bei 2 von 16GB, Festplatte Datenbewegung unter ferner liefen und Netzwerk praktisch ruhig. Das ist das Bild, was sich mir geboten hat.

Aber in meinem Post von vor wenigen Minuten steht, wie es jetzt aussieht, daher hier nur nochmal meine Antwort auf Deine Frage, wie das Bild eigentlich aussah.

Gruß

Y.
Mitglied: falscher-sperrstatus
Lösung falscher-sperrstatus 28.10.2016 um 17:02:16 Uhr
Goto Top
Also, wie erwartet auf dem gleichen Storage.

Darf ich auf folgenden ersten Satz hinweisen:


Zitat von @YotYot:

und das braucht nicht hinterfragt zu werden - reichlich Leistung.
face-wink

Schönes We!
Mitglied: YotYot
YotYot 31.10.2016 um 08:18:15 Uhr
Goto Top
Naja, die Leistung ist ja tatsächlich reichlich, Fehler gibt es auch keine, alle Logs sind praktisch leer (also positiv gefüllt) und andere Maschinen, die auf diesem Storage liegen, haben das Problem ja auch nicht. Ein direkter Leistungstest auf genau diesem Storage bringt die 40-fache Leistung zustande, wenn man mal nur die Übertragungsraten hernimmt. Das macht die Ursachensuche nicht unbedingt einfacher...
Mitglied: YotYot
YotYot 30.11.2016 um 08:56:28 Uhr
Goto Top
Sooo....
das Problem ist gelöst, die Ursache gefunden und meine Kollegen sind sehr kleinlaut. Jedenfalls einer davon.

Tatsächlich ist Leistung im Überfluss in allen Bereichen vorhanden, die unerklärliche Langsamkeit einzelner Systeme (VMs) auf einem der RAIDs, die allesamt aus mindestens zwölf 10.000er Platten mit je 6Gbit/s (RAID 5) bestehen, kam ans Licht, als die I/O-Leistung mal genauer untersucht wurde: ein Kollege hatte sich zum Testen eine VM erzeugt, die mal kurzerhand 3TB Logdateien, Tendenz steigend, per Elastic Search durchsucht hat. Echtzeitergebnisse schön und gut, seit ein paar Tagen aber dann doch auf einem eigenen Plattensystem, seitdem läuft alles wieder wie gewünscht.

Das passiert, wenn "wichtige Leute" an Dingen schrauben dürfen (VM-Platten erzeugen zum Beispiel), die doch besser von den jeweiligen Admins geschraubt werden sollten.

Grüße

Y.
Mitglied: falscher-sperrstatus
falscher-sperrstatus 30.11.2016 um 11:13:58 Uhr
Goto Top
Sehr nettes Ergebnis, auf das wohl keiner hätte kommen können. face-wink