118080
Goto Top

Testen der Backup Strategie

Moin face-smile

Ich habe seit ich die Backupstrategie vor 2 Jahren angepasst habe, diese noch nie getestet. Ich weiss.. Schande über mich..
Und der Data Recovery ist ja ein wichtiger Teil der Backup Strategie. Darum wird es höchste Zeit um das mal zu testen.
Ich benutze hierzu die Onboard Windows Sicherung (Windows Server 2012 R2) um auf eine lokale Festplatte zu sicher. Diese wird dann einmal in der Woche auf eine externe Festplatte geklont. Welche ausser Haus gelager wird.
Ich habe schon von beiden Dateien oder grosse Systemordner ohne Probleme zurückgespielt. Nun möchte ich einmal ein komplettes Systemabbild zurückspielen.

Was gibt es zu beachten bei so einem Test? Was könnt ihr mir für Tipps geben?

LG Luca

Content-Key: 303483

Url: https://administrator.de/contentid/303483

Printed on: May 6, 2024 at 15:05 o'clock

Member: Chonta
Solution Chonta May 02, 2016 at 14:33:14 (UTC)
Goto Top
Hallo,

dann probiere doch gleich mal den Ernstfall, der Server ist geklaut worden und Du hast jetzt einen neuen Server da stehen unbenutzt unbespielt und die externe Platte.
Und der Chefe will in X Stunden wieder an die Daten ran.

Die Zeit läuft.

Gruß

Chonta
Member: BernhardMeierrose
Solution BernhardMeierrose May 02, 2016 at 14:44:30 (UTC)
Goto Top
Moin Moin,

es ist doch sehr positiv, dass Du es jetzt machen willst. Also nicht über die Vergangenheit ärgern.

Ich empfehle immer, verschiedene Szenarien durchzuspielen. Also für den totalen DR zum Beispiel mit einem nackten Blech anfangen und den Restore einleiten. Für einen simulierten Ausfall der Daten-Partition reicht dann ein entsprechendes Teil-Restore.
- Jeden Schritt dokumentieren ! (wenn Du im Urlaub bist, muss ggf. jemand anders den Restore durchführen, wenn es die Ressourcen erlauben sollte sogar mal jemand anders den Test durchführen)
- Wenn die Test-Hardware ähnlich skaliert ist wie das Produktiv-System: Zeiten nehmen, dann kannst Du Aussagen treffen, wie lange der Restore im Ernstfall benötigt.
- Wirklich ALLES zurücksichern, der Teufel steckt im Detail. Der Test ist erst abgeschlossen, wenn ALLE User wieder arbeiten könnten.
- Analysieren, wie groß der faktische Verlust im Restore-Fall ist (also in der Zeit zwischen simuliertem Crash und letztem Backup-Stand), hier auch ggf. mit den Fachabteilungen sprechen (FiBu, Produktion, HR) ob der Verlust für die tolerierbar ist, ggf. Strategie anpassen.

Und zu guter Letzt: Nach abgeschlossenem Test-Restore das Test-System sauber löschen, da sind ja logischerweise vertrauliche Daten drauf gekommen.

Gruß
Bernhard
Mitglied: 118080
118080 May 02, 2016 at 15:10:22 (UTC)
Goto Top
Moin face-smile
Zitat von @Chonta:
dann probiere doch gleich mal den Ernstfall, der Server ist geklaut worden und Du hast jetzt einen neuen Server da stehen unbenutzt unbespielt und die externe Platte.
Und der Chefe will in X Stunden wieder an die Daten ran.
Ich werde es so realitätsnah wie möglich machen. Manche Leute werden jetzt evtl sagen ich bin verrückt.. Aber ich habe einen RAID 1 im Server und werde eine Platte aus dem System nehmen.. Evtl die drin gelassene Platte ein wenig künstlich verwüsten und unbrauchbar machen und dann versuchen das Backup draufzuspielen. In einem weiteren Szenario werde ich alle Platten rausnehmen und eine ungebrauchte Platte reinschmeissen und dort das Backup Bare Metal drauszuspielen. Ich werde folgende Szenarien simulieren:
- Beide Platten des Raids sind zerschossen und von der internen Sicherung zurückspielen
- Durch Überspannung z.B. ist alle Hardware inkl. interner Sicherung unbrauchbar => von externer Sicherungsplatte zurückspielen


Zitat von @BernhardMeierrose:
Für einen simulierten Ausfall der Daten-Partition reicht dann ein entsprechendes Teil-Restore.
Dies musste ich schon machen und das klappt super face-smile
- Jeden Schritt dokumentieren ! (wenn Du im Urlaub bist, muss ggf. jemand anders den Restore durchführen, wenn es die Ressourcen erlauben sollte sogar mal jemand anders den Test durchführen)
Daran hatte ich gar nicht gedacht...
- Analysieren, wie groß der faktische Verlust im Restore-Fall ist (also in der Zeit zwischen simuliertem Crash und letztem Backup-Stand), hier auch ggf. mit den Fachabteilungen sprechen (FiBu, Produktion, HR) ob der Verlust für die tolerierbar ist, ggf. Strategie anpassen.
- Wenn das System noch bootfähig ist, ist der Verlust maximal 4h
- Ist die interne Sicherungsplatte noch intakt beträgt der Verlust maximal 8h..
- Wenn der Server z.B. geklaut wurde dann ist der Verlust etwa 1 Woche. (Ich persönlich finde das zu viel, aber die Geschäftsleitung meinte das reicht.)
Und zu guter Letzt: Nach abgeschlossenem Test-Restore das Test-System sauber löschen, da sind ja logischerweise vertrauliche Daten drauf gekommen.
Logisch, würde da mit einem Wiper drüber face-smile
Member: BernhardMeierrose
Solution BernhardMeierrose May 02, 2016 at 15:15:13 (UTC)
Goto Top
Zitat von @118080:
Ich werde es so realitätsnah wie möglich machen. Manche Leute werden jetzt evtl sagen ich bin verrückt.. Aber ich habe einen RAID 1 im Server und werde eine Platte aus dem System nehmen.. Evtl die drin gelassene Platte ein wenig künstlich verwüsten und unbrauchbar machen und dann versuchen das Backup draufzuspielen.

Öhm.. Niemals mit der Produktivhardware spielen...
Wenn Dir in dem Fall zufällig (Schönen Gruß von Murphy) die letzte Platte mit den Produktivdaten flöten geht, reißt Dir Chef den Kopf ab. Und er täte es mit gutem Recht !

Gruß
Bernhard
Member: Chonta
Solution Chonta May 02, 2016 at 15:19:42 (UTC)
Goto Top
Hallo,

also bevor Du deinen "Plan" mit dem absichtlichen zerschißen des Produktivsystems in die Tat umsetzt.
Mach einen Snapshot von deinem System stell das in einer vom Netz getrenten VM her und spiele Damit.

Ich würde mit dem größten Desaster Fall anfangen, weil wenn der Restore damit schon nicht geht, brauchst Du eh eine andere Strategie.
Sollte es gehen, kannst Du auf dem wiederhergestellten aufbauen für die anderen Szenarien.

Gruß

Chonta
Mitglied: 118080
118080 May 03, 2016 at 06:14:24 (UTC)
Goto Top
Zitat von @BernhardMeierrose:
Öhm.. Niemals mit der Produktivhardware spielen...
Und wenn ich alle Platten rausnehme und neue rein packe?
Wenn Dir in dem Fall zufällig (Schönen Gruß von Murphy) die letzte Platte mit den Produktivdaten flöten geht, reißt Dir Chef den Kopf ab. Und er täte es mit gutem Recht !
Murphys Law... Und ich wollte gerade sagen wie Wahrscheinlich das denn schon ist face-big-smile


Zitat von @Chonta:
Ich würde mit dem größten Desaster Fall anfangen, weil wenn der Restore damit schon nicht geht, brauchst Du eh eine andere Strategie.
Sollte es gehen, kannst Du auf dem wiederhergestellten aufbauen für die anderen Szenarien.
Macht eigentlich Sinn. Werde ich so machen face-smile
Member: Chonta
Solution Chonta May 03, 2016 at 06:38:44 (UTC)
Goto Top
Und nimm NICHT das Produktivsystem zum Testen. Mach das mit separater Hardware oder VM
Im Schlimmsten Fall zwespielst Du den Raid und der will die alten Platten nicht wieder haben.

Gruß

Chonta
Mitglied: 118080
118080 May 09, 2016 at 08:19:42 (UTC)
Goto Top
Also ich habe nun bei einem Server die interne sowie die externe Sicherung draufgespielt. -> erfolgreich
Bei einem anderen Server nur noch die externe, dies sollte aber reichen, da die externe Sicherung ja nur eine Kopie der internen ist.

Also sollte es funktionieren face-smile