derteufelimdetail
Goto Top

Hyper-V: VM-Replikation hält nicht an und wird nicht gestoppt

Liebe Gemeinde!

Auf unserem primären Hyper-V-Server laufen derzeit 41 VMs. Dieser werden im 5-Minuten-Takt auf das baugleiche Failover-System repliziert.
Von diesem Failover-System werden täglich Backups der VMs gemacht.
Diese Backups dauern teilweise so lange, das die Replikation angehalten wird und der Status auf kritisch springt. Dann ist manuelles eingreifen erforderlich.
Also halte ich die Replikation für acht Stunden an... dachte ich:

Folgendes Script führe ich aus:

$replicatingMachines = @(Get-VMreplication | Where { $_.State -eq 'Replicating' })
ForEach($singleMachine in $replicatingMachines){suspend-vmreplication($singleMachine)}

- Ausführen von .ps1 im Scheduler (Angelegt als "Administrator / Ausführung als Administrator, unabhängig, höchste Privilegien):
... In den Aktionen sage ich Programm starten "powershell.exe"
Dann in den Argumenten: -ExecutionPolicy Bypass C:\Pfad\suspending_rep.ps1
Starten in: C:\Pfad\

Ergebnis:
- Scheduler sagt: Erfolgreich beendet
- Hyper-V sagt: Status "Warnung"
- Repl.-Statistik: Replizierung angehalten
- Es werden offensichtlich keine Replizierungen mehr durchgeführt, da im Hyper-V-Manager der Maschinenstatus nie wieder "Replizieren der Änderungen" auftaucht.

Nach einer Stunde nachgeschaut, alle "Kritisch", weil die verpassten Replikationszyklen zu viele geworden sind.

Verstehe ich den Sinn von "Replikation anhalten" nicht oder was läuft da schief?


Schon mal wieder einen riesen Dank im Voraus!

EDIT: Wenn ich so nachdenke könnte ich die Replikation anhalten, "Health" auf "Critical" setzen und nachher wieder alles rückgängig machen... Aber das kann doch nicht die Lösung sein.

Content-Key: 239893

Url: https://administrator.de/contentid/239893

Ausgedruckt am: 29.03.2024 um 11:03 Uhr

Mitglied: falscher-sperrstatus
falscher-sperrstatus 03.06.2014 um 09:33:36 Uhr
Goto Top
Hallo,

vermutlich würde ich erstmal wo anders ansetzen: 41 VMs auf einem Server? Wie stark ist dieser? Wie sichert ihr die Daten weg?

Grüße,

Christian
Mitglied: DerTeufelImDetail
DerTeufelImDetail 03.06.2014 um 09:56:26 Uhr
Goto Top
- Dual-CPU ( 2 * 12 Kern á 2,6 GHz)
- 256GB DDR3 ECC RAM
- Win 2012 R2 Std. mit Hyper-V-Rolle
- VMs mit je 4 bis 6 Kernen dynamisch zugewiesen und 4 bis 8 GB RAM dynamisch
- System SSDs 2*500GB RAID-1 (Adaptec..blah)
- Daten HDDs 10 * SATA3 WD 1TB Enterprise Storage RAID-5

Failoversystem ist baugleich nur mit 1,9GHz CPUs

Replikation der VMs alle 5 Minuten.

Bisher gab es aber nur den primären Server. (System läuft schnell und sicher seit gut 3 Jahren) Backups wurden von den heruntergefahrenen Maschinen gemacht.
Da wir aber 24/7-Betrieb brauchen, haben wir das sekundär-System gebaut.

Wir haben einen Backupserver mit 30TB gebaut. Dort läuft täglich ein .jar-File, welches die .vhd-Dateien sucht (diese sind mit P1, P2, P3 und P9-Präfix versehen). Diese werden dann in einem bestimmten Intervall vom Sekundärsystem gezogen und in eine spezielle Ordnerhierarchie gespeichert...

Während dieses Vorgangs kann der Primärserver die Änderungen nicht auf den Sekundärserver übertragen. Darum das Anhalten der Replikation über einen bestimmten Zeitraum.
Mitglied: falscher-sperrstatus
falscher-sperrstatus 03.06.2014 um 10:05:25 Uhr
Goto Top
Klingt auch etwas komplex. Vermute die Platten bringen nicht den Durchsatz und dass die Replikation dann stirbt ist logisch.

Wie sieht das .jar File aus (und warum dann nicht direkt per Powershell?)

Abgesehen davon dürfte der Einsatz einer "ordentlichen" Backuplösung vielleicht nicht die schlechteste Option sein.
Mitglied: DerTeufelImDetail
DerTeufelImDetail 03.06.2014 um 12:12:04 Uhr
Goto Top
Die Replikation läuft einwandfrei! Wenn ich das Backup ausschalte (auf dem Backupsystem) läuft die Replikation 14 Tage durch, ohne einmal zu zicken.

Beim Backup müssen die Daten durchs Ethernet. 1Gbit. Mehr ist physikalisch nicht drin. Wenn ich Daten auf eine USB 3.0 schreibe, kann ich über 190MB pro Sekunde übertragen. Durchs Netz gehen nur 110MB. An den HDDs liegst wohl nicht.
Die VHDs haben teilweise ein Größe von 250GB und mehr. D.h. die sind beim Zugriff zu lange nicht freigegeben. Darum will ich die Replikation ja eben kurz anhalten.

Und Komplex is da garnix...

1. primärer Hypervisor ( Hostet VMs .... sonst nix )
2. sekundärer Hypervisor ( empfängt Replikation .... sonst nix )
3. Backupserver ( zieht Backups und verwaltet sie .... sonst nix )

Was ist denn daran komplex?
Mitglied: falscher-sperrstatus
falscher-sperrstatus 03.06.2014 um 12:37:12 Uhr
Goto Top
Dein Backupverfahren ist zu komplex für die Menge an zu sichernden Daten, deswegen wirft die Replikation auch den Fehler. Du brauchst etwas, dass Standby sichern kann und nicht alles tod macht, bevor es sichert.
Mitglied: DerTeufelImDetail
DerTeufelImDetail 03.06.2014 um 13:26:42 Uhr
Goto Top
Du verstehst, glaube ich, mein Problem nicht.

Ich halte die Replikation an. Alles sagt mir, sie sei angehalten. Trotzdem wird offensichtlich weiter repliziert.
Darum treten Fehler auf.
Wenn ich das Backup abschalte, gibt es keine Fehler mit der Replikation.

Ich halte an, trotzdem Fehler. Warum?

Du verstehst?

Ich halte die Replizierung an. Nach meinem Verständnis wird dann nicht mehr Repliziert, bis ich sie fortfahre.
Mitglied: falscher-sperrstatus
falscher-sperrstatus 03.06.2014 um 13:33:44 Uhr
Goto Top
Offensichtlich ist dem aber nicht so face-smile Du verstehst. Also musst du entweder hole jemanden, der weiss, was Problem, oder selbst danach schauen, oder du musste dir eingestehene, dasse das Szenario zu komplex ist.

Denn: weniger komplex: weniger Problem, hier: Komplex, hier Problem ;)