stefts
Goto Top

Image Wiederherstellung bei fehlerhaften Sektoren

Hallo,

wir haben bei einem Server mit SBS 2011 folgendes Problem: Nach Ausfall und Tausch einer Festplatte im RAID1-Verbund, haben wir festgestellt, dass das RAID Rebuild sehr lange dauert (ca. 2 Tage bei 250 GB Datenmenge) und sich allgemein auf die Server-Performance niederschlägt. Dies ist laut Fujitsu Support auf fehlerhafte Sektoren im RAID1 zurückzuführen, die während des Rebuilds mit übernommen werden. Jetzt stehen wir natürlich vor einem großen Problem.

Es wurde uns empfohlen das RAID komplett neu aufzusetzen und ein Backup wiederherzustellen. Das Backup machen wir Imagebasiert mittels Symantec System Recovery. Nun ist die Frage: Wenn wir das RAID komplett neu erstellen, können wir dann Image problemlos zurückspielen oder haben wir dann genau die selbe Situation?

Vielen Dank vorab.

VG, hfranzts

Content-Key: 254075

Url: https://administrator.de/contentid/254075

Printed on: April 23, 2024 at 14:04 o'clock

Member: keine-ahnung
keine-ahnung Nov 06, 2014 updated at 16:12:29 (UTC)
Goto Top
Moin,
haben wir festgestellt, dass das RAID Rebuild sehr lange dauert (ca. 2 Tage bei 250 GB Datenmenge)
Jetzt stehen wir natürlich vor einem großen Problem.
Vor was für einem Problem, das rebuild ist doch fertig?

Mit Deinen Infos kann man auch nix anfangen ... ist das rebuild online oder offline angeschoben, was ist das für ein controller, was sind das für Platten???

Wenn wir das RAID komplett neu erstellen, können wir dann Image problemlos zurückspielen oder haben wir dann genau die selbe Situation?
Was für eine Situation? Rebuilden müsst Ihr dann ja nix mehr ...

LG, Thomas
Member: stefts
stefts Nov 06, 2014 updated at 16:46:20 (UTC)
Goto Top
Sorry, hab in der Eile einige Infos vergessen.

Es handelt sich um einen Fujitsu TX100 S2 mit Software RAID (LSI Embedded Mega RAID). 2012 entstanden das erste Mal Medium Sense Errors. Die betroffene Festplatte wurde im September diesen Jahres getauscht. Die Fehler kamen aber erneut woraufhin wir gestern die Platte ein weiteres mal tauschten. Das Rebuild läuft aktuell noch durch (wie gesagt sehr langsam) und im laufenden Betrieb (ich nehme das meintest du mit online)

Hier mal der Auszug der Mail des Fujitsu Supports:

"Wie telefonisch besprochen, treten auf die Festplatte Slot 0 immer wieder Medium Fehler. Die Fehlermeldung ist im September 2012 am erstenmal aufgetreten. Momentan sind zu viel Blocks im raid Verbund betroffen.
Wegen mehrerer Medium Fehler hat der RAID Kontroller diese BLOCKS als "beschädigte" markiert. Diese Option von LSI Kontroller nennt man RAID Puncturing.
Das Problem ist, dass während des Rebuilds die Information über beschädigten Blocks auf neue Festplatte kopiert wird.
Im Raid wiederherzustellen, soll man das RAID Verbund neuerstellen.

1. Erstellen Sie bitte eine Sicherungskopie von allen Festplatten, die zu dem RAID Kontroller angeschlossen sind.
2. Löschen Sie bitte die RAID COnfiguration und erstellen Sie bitte neue Konfiguration mit full Initialization(!) 3. Dann kann man die Dateien wiederherstellen."


Nun wie gesagt die Frage, ob ein Restore des System Recovery Image Sinn macht oder ob die Sektorenfehler bestehen bleiben.
Member: goscho
Solution goscho Nov 06, 2014, updated at Nov 10, 2014 at 14:40:51 (UTC)
Goto Top
Hallo hfranzts

hast du dein Backup mit System Recovery schon mal getestet?
Dieses geht auf verschiedene Weisen, z.B.:

  • gleicher Server mit anderen HDDS und wiederhergestellt
  • anderer PC/Server/VM und System komplett wiederhergestellt (Restore Anyware)
  • Wiederherstellungspunkt auf einem PC/Server mit SSR im Explorer bereitstellen (Kontextmenü beim Anklicken des Recovery-Points)
  • Wiederherstellungspunkt durchsuchen um Dateien wiederherzustellen

Es wurde uns empfohlen das RAID komplett neu aufzusetzen und ein Backup wiederherzustellen.
Das ist immer dann die beste Idee, wenn das System nicht mehr sauber läuft und das Backup funktioniert. Ich würde es auf andere HDDs machen. face-wink

Das Backup machen wir Imagebasiert mittels Symantec System Recovery.
Nicht die schlechteste Entscheidung gewesen, denke ich. face-wink
Nun ist die Frage: Wenn wir das RAID komplett neu erstellen, können wir dann Image problemlos zurückspielen oder haben wir dann genau die selbe Situation?
Das hängt komplett von deiner Sicherung ab.
Beim Erstellen des Sicherungsjobs mit SSR gibt es einen Punkt (unter Optionen -> erweitert), an welchem "fehlerhafte Sektoren während des Kopierens ignoriert" werden können. Dort sollte bei einem SBS auch der Haken für "Vollständiges VSS-Backup durchführen" gesetzt und ein Verschlüsselungskennwort eingerichtet werden.

Wenn die fehlerhaften Sektoren nicht ignoriert werden, dürfte es nur vollständige Sicherungen geben, die i.O. sind. Das ist allerdings zu prüfen, so wie oben beschrieben.
Wenn der Haken drinnen war, dann gab es zwar eine Sicherung. Diese wird nach dem wiederherstellen aber die selben Probleme aufweisen, die das Volume jetzt zeigt.
Eventuell scheitert gar die Wiederherstellung deshalb komplett.
Member: keine-ahnung
keine-ahnung Nov 06, 2014 at 17:32:56 (UTC)
Goto Top
Hi nochmal,

mit dem SBS seid Ihr doch nicht 7/24 am Spielen? Warum besorgt Ihr Euch nicht einen vernünftigen SAS-controller nebst Platten und bügelt das am Wochenende wieder zurück? Sicherheitshalber würde ich auch mal eine baremetal-Sicherung der Büchse über die onboard-SBS-Sicherung machen, Redundanz kann nicht schaden face-wink!

LG, Thomas
Member: goscho
goscho Nov 06, 2014 updated at 22:03:30 (UTC)
Goto Top
Die Sicherung mittels SSR ist 2 Klassen besser als die des SBS.
Lieber eine vernünftige als 2, von denen man nicht viel weiß.
Member: the-buccaneer
Solution the-buccaneer Nov 06, 2014, updated at Nov 10, 2014 at 14:40:57 (UTC)
Goto Top
Nach meinem Verständnis habt ihr nicht die gleiche Situation, denn ein Rückspielen der Sicherung ist ja eben kein RAID Rebuild sondern spielt die Dateistruktur auf ein neues sauberes RAID zurück.

Vorsichtshalber würde ich das aber auf 2 neue HD's aufspielen, denn wenn die Sicherung nicht will, bist du sonst tot. face-wink

Nichtsdestotrotz: Was spricht dagegen, das durchlaufen zu lassen und es dann ruhen zu lassen? Da sind dann eben ein paar eigentlich korrekte Sektoren auf der neuen HD nicht anprechbar. So what? face-wink

Buc
Member: stefts
stefts Nov 10, 2014 at 14:12:17 (UTC)
Goto Top
Moin,

vielen Dank für die Tipps. Das Backup lief am WE glücklicherweise problemlos durch und die Optionen sind auch wie von Goscho empfohlen eingestellt. Ich werde dann wohl diese Woche das Backup auf einer anderen Maschine mal testweise zurücksetzen. Sonst bin ich in der Tat tot :D

VG