jackoe
Goto Top

Raid 5 Volume im inaktiven Modus nach HDD-Tausch

Servus zusammen,

ich habe eine Frage zu einem QNAP NAS-Server.
Typ: TS-439+
4 x 1TB Seagate HDDs
einfach als RAID 5-Verbund
keine Virtualisierung etc.

Über einen Ratschlag würde ich mich sehr freuen. Hier mein Problem:

Nachdem vergangenen Samstag eine Festplatte aus dem Raid 5-Verbund (4/4) nicht mehr erkannt wurde, habe ich Ersatz bestellt.
Heute Nacht ergab ein automatischer S.M.A.R.T-Test, dass eine weitere Platte (3/4) rellocated secors besitzt. DIESE MELDUNG HABE ICH ÜBERSEHEN.
Heute Morgen habe ich die defekte HDD 4/4 per Hot-Swap gewechselt und das System begann mit dem Rebuilt.
Nach ca. 3 Stunden und 10 Minuten erhielt ich einen I/O error (s. unten, Eintrag 4671) der HDD 3/4.
Seitdem ist das Volume in einem inaktiven Modus.

Was kann ich jetzt tun, um vielleicht doch noch an meine Daten zu gelangen?

Ich habe eine bad sector-Suche angestoßen, diese ist derzeit am "Suchen". Doch was mache ich danach?

Danke im Voraus!

Hier der Auszug aus der "system.log":

4676,"Information","2017-08-31","15:35:13","System","127.0.0.1","localhost","[Drive 3] Start scanning bad blocks."
4675,"Information","2017-08-31","14:08:54","System","127.0.0.1","localhost","[UPS] USB UPS device plugged in."
4674,"Information","2017-08-31","14:06:46","System","127.0.0.1","localhost","System started."
4673,"Warning","2017-08-31","14:06:45","System","127.0.0.1","localhost","The system was not shut down properly last time."
4672,"Warning","2017-08-31","13:15:02","System","127.0.0.1","localhost","[Harddisk 3] medium error. Please run bad block scan on this drive or replace the drive if the error persists."
4671,"Warning","2017-08-31","12:53:28","System","127.0.0.1","localhost","[Harddisk 3] I/O error, sense_key=0x3, asc=0x11, ascq=0x4, CDB=28 00 74 5f b6 88 00 04 00 00 ."
4670,"Information","2017-08-31","09:43:13","System","127.0.0.1","localhost","[RAID5 Disk Volume: Drive 1 2 3 4] Start rebuilding."
4669,"Information","2017-08-31","09:43:02","System","127.0.0.1","localhost","[RAID5 Disk Volume: Drive 1 2 3 4] Drive 4 added into the volume."
4668,"Information","2017-08-31","09:42:32","System","127.0.0.1","localhost","Drive 4 plugged in."
4667,"Information","2017-08-31","03:49:50","System","127.0.0.1","localhost","[HDD SMART] HDD 1 Complete Test result: Completed without error(s)."
4666,"Information","2017-08-31","03:46:50","System","127.0.0.1","localhost","[HDD SMART] HDD 2 Complete Test result: Completed without error(s)."
4665,"Error","2017-08-31","03:39:20","System","127.0.0.1","localhost","[HDD SMART] HDD 3 Complete Test result: Completed: read failure."
4664,"Information","2017-08-31","01:00:02","System","127.0.0.1","localhost","[HDD SMART] HDD 2 Complete Test started."
4663,"Information","2017-08-31","01:00:02","System","127.0.0.1","localhost","[HDD SMART] HDD 1 Complete Test started."
4662,"Information","2017-08-31","01:00:01","System","127.0.0.1","localhost","[HDD SMART] HDD 3 Complete Test started."
4659,"Warning","2017-08-26","22:16:05","System","127.0.0.1","localhost","[RAID5 Disk Volume: Drive 1 2 3 4] RAID device in degraded mode."
4658,"Information","2017-08-26","22:16:04","System","127.0.0.1","localhost","[RAID5 Disk Volume: Drive 1 2 3 4] Drive 4 removed."
4657,"Error","2017-08-26","22:15:54","System","127.0.0.1","localhost","Drive 4 unplugged."
4656,"Information","2017-08-26","22:01:27","System","127.0.0.1","localhost","Host: Drive4 read error corrected."
4655,"Warning","2017-08-26","22:01:26","System","127.0.0.1","localhost","[Harddisk 4] medium error. Please run bad block scan on this drive or replace the drive if the error persists."
4654,"Warning","2017-08-26","22:01:18","System","127.0.0.1","localhost","[Harddisk 4] I/O error, sense_key=0x3, asc=0x11, ascq=0x4, CDB=28 00 03 a0 5c 08 00 00 08 00 ."
4651,"Information","2017-08-26","04:04:41","System","127.0.0.1","localhost","[HDD SMART] HDD 2 Rapid Test result: Completed without error(s)."
4650,"Information","2017-08-26","04:01:17","System","127.0.0.1","localhost","[HDD SMART] HDD 1 Rapid Test result: Completed without error(s)."
4649,"Information","2017-08-26","04:01:07","System","127.0.0.1","localhost","[HDD SMART] HDD 4 Rapid Test result: Completed without error(s)."
4648,"Error","2017-08-26","04:00:47","System","127.0.0.1","localhost","[HDD SMART] HDD 3 Rapid Test result: Completed: read failure."
4647,"Information","2017-08-26","04:00:05","System","127.0.0.1","localhost","[HDD SMART] HDD 1 Rapid Test started."
4646,"Information","2017-08-26","04:00:04","System","127.0.0.1","localhost","[HDD SMART] HDD 2 Rapid Test started."
4645,"Information","2017-08-26","04:00:03","System","127.0.0.1","localhost","[HDD SMART] HDD 3 Rapid Test started."
4644,"Information","2017-08-26","04:00:02","System","127.0.0.1","localhost","[HDD SMART] HDD 4 Rapid Test started."

Content-Key: 347845

Url: https://administrator.de/contentid/347845

Printed on: April 19, 2024 at 01:04 o'clock

Member: Henere
Henere Aug 31, 2017 updated at 15:21:42 (UTC)
Goto Top
Servus,
Magst Du vielleicht nicht lesen, aber entweder ein professioneller Datenretter oder ein Einspielen das Backups. Viel mehr Möglichkeiten hast Du nicht.
Member: Jackoe
Jackoe Aug 31, 2017 at 15:26:24 (UTC)
Goto Top
Besteht denn die Möglichkeit, dass ich meine defekte 4/4 HDD wieder anstecke und hoffe, dass sie zumindest für das Auslesen der Daten "hält".
Oder wurde mit dem rebuild an dem Verbund zu viel verändert?
Member: Henere
Henere Aug 31, 2017 at 15:32:57 (UTC)
Goto Top
Deiner Antwort nach zu urteilen, gibt es kein weiteres Backup ?
Bevor Du selbst irgendwelche Versuche startest, zieh von jeder Deiner Platten unbedingt ein Image.
Danach könnte man es probieren was von dem RAID noch kommt. So kannst Du zumindest auf den Jetzigen- bzw. Ausgangszustand zurück.
Aber: Du hast ja schon den Rebuild gestartet, da könnte einiges auf den Platten durcheinander gekommen sein.

Viel Glück !
Member: Jackoe
Jackoe Aug 31, 2017 at 15:45:19 (UTC)
Goto Top
Es gibt ein partielles Backup, welches aktuell ist. Demnach ist die Not nicht allzu groß.
ABER:
Ein Großteil wurde nicht zusätzlich gesichert. Daten sind zwar noch vorhanden, aber auf diversen Datenträgern verteilt! Viel mehr geht es mir darum, dass sämtliche Daten auf dem NAS "zentral" gespeichert waren.
Member: Jackoe
Jackoe Aug 31, 2017 at 21:28:11 (UTC)
Goto Top
Ich habe eine neue Idee. Könnte ich nicht folgendermaßen vorgehen:

HDD 1/4 und 2/4 funktionieren ja einwandfrei, diese im system belassen
HDD 3/4 -> Image erstellen und auf neue HDD clonen
HDD 4/4 -> Image erstellen und auf neue HDD clonen

Alle platten wieder in der NAS einsetzen und hoffen, dass alles wieder verfügbar ist.
Member: Vision2015
Vision2015 Sep 01, 2017 at 03:00:31 (UTC)
Goto Top
Moin,
Zitat von @Jackoe:

Ich habe eine neue Idee. Könnte ich nicht folgendermaßen vorgehen:

HDD 1/4 und 2/4 funktionieren ja einwandfrei, diese im system belassen
HDD 3/4 -> Image erstellen und auf neue HDD clonen
HDD 4/4 -> Image erstellen und auf neue HDD clonen

Alle platten wieder in der NAS einsetzen und hoffen, dass alles wieder verfügbar ist.
wenn die Paritätsinformationen nicht vollständig sind, wird das nix....
und wenn du genug zeit hast, kannst du das ja mal testen, wenn nicht- mach das Raid neu!
evtl. überlegst du mal auf ein Raid6 bzw. gar Raid10 zu bauen!

> Es gibt ein partielles Backup, welches aktuell ist. Demnach ist die Not nicht allzu groß.
ABER:
Ein Großteil wurde nicht zusätzlich gesichert. Daten sind zwar noch vorhanden, aber auf diversen Datenträgern verteilt! Viel mehr geht es mir darum, dass sämtliche Daten auf dem NAS "zentral" gespeichert waren.
hm.. lustige Antwort... face-smile
Ein Großteil wurde nicht zusätzlich gesichert
würde mir und meinen Kunden eher Sorgen bereiten....
evtl. machst du dir ja mal gedanken, das du ein Backup der ganzen daten erstellst.... ist ja auch immer die frage, wie wichtig sind diese daten für dich!
ich würde die Seagate HDD´s in die Tonne kloppen, und WD Red´s einbauen... oder HGST. bei den WD´s gibbet eine Pro reihe- die sind etwas teurer, aber schneller!

Frank
Member: Dr.EVIL
Dr.EVIL Sep 01, 2017 updated at 12:26:30 (UTC)
Goto Top
Ich denke auch das wenn man die Daten auf dem billgsten Storage am Markt ablegt und davon kein Backup macht, diese ja nicht allzu wichtig sein können.
Daher (selbst wenn eine Inbetriebnahme gelingen sollte):
Taiwanesische NAS Dose samt Billigplatten in die Tonne werfen (bzw. bei E-Bay an irgendeinen Idioten verticken) !
Danach einen richtigen "Fileserver" mit einer verlässlicheren Hardware beschaffen und die noch zu rettenden Daten zurücksichern.
Den restlichen Datenverlust als "Lehrgeld" verbuchen und ab jetzt regelmäßige Backups/Restores machen.
face-wink
Member: Henere
Henere Sep 01, 2017 at 16:48:37 (UTC)
Goto Top
Zitat von @Dr.EVIL:
Taiwanesische NAS Dose samt Billigplatten in die Tonne werfen (bzw. bei E-Bay an irgendeinen Idioten verticken) !

Einspruch. Synergy und QNAP sind mit die besten NAS-Dosen.

Dennoch ist es unerlässlich, wenn diese als Fileserver genutzt werden, die Daten noch zusätzlich zu sichern.

Meine Daten liegen auf nem 2016er mit Raid0 wegen der Performance. Backup alle 24h auf ein QNAP mit Raid5.
Die allerwichtigsten Daten werden alle 2 Wochen auf 2 externen HD gesichert, die ich bei nem Bekannten 10km weiter gelagert habe. Diese sind immer im Wechsel.

So sollte nichts verloren gehen oder zumindest mit geringem Einsatz wiederhergestellt werden können.
Member: Dr.EVIL
Dr.EVIL Sep 04, 2017 at 08:38:49 (UTC)
Goto Top
Zitat von @Henere:

Zitat von @Dr.EVIL:
Taiwanesische NAS Dose samt Billigplatten in die Tonne werfen (bzw. bei E-Bay an irgendeinen Idioten verticken) !

Einspruch. Synergy und QNAP sind mit die besten NAS-Dosen.

Du hast "Zyxel" und "Buffalo" und die selbsgebastelten "Rasberry Storages" vergessen... face-wink


Dennoch ist es unerlässlich, wenn diese als Fileserver genutzt werden, die Daten noch zusätzlich zu sichern.

Dies ist unabhängig vom verwendeten Primärspeicher IMMER so!

Meine Daten liegen auf nem 2016er mit Raid0 wegen der Performance. Backup alle 24h auf ein QNAP mit Raid5.
Die allerwichtigsten Daten werden alle 2 Wochen auf 2 externen HD gesichert, die ich bei nem Bekannten 10km weiter gelagert habe. Diese sind immer im Wechsel.

So sollte nichts verloren gehen oder zumindest mit geringem Einsatz wiederhergestellt werden können.

Mir scheint Du erhebst hier den Fehler zum "Normalzustand"...
Auf RAID0 legt man keine Daten ab!
RAID0 ist höchstens als (SSD) Cache-Speicher akzeptabel, wenn eine Kopie der Daten irgendwo anders auf dem Storage liegen.

Die Wahrscheinlichkeit eines Fehlers auf einer Festplatte und damit im RAID0 eines Totalverlustes der Daten ist SEHR HOCH.
Die Wahrscheinlichkeit hängt natürlich auch von den verwendeten Platten ab: Bei zwei einer "Enterprise" SFF SAS Platte mit 10k und 300GB ist sie sicherlich nicht so hoch wie auf irgendeiner "Consumer" LFF "Nearline" SATA Platte mit 5400 oder 7200 U/min. mit mehreren TB.
Selbst bei einer noch so hohen abfolge von Datensicherungen ist hier ein Dateverlust äusserst wahrscheinlich.
(Akzeptabel allenfalls als Ablage von geklauten MP3 oder Videos im privaten Umfeld, da man diese im Fehlerfall noch mal klauen kann...) face-wink
Member: Henere
Henere Sep 04, 2017 at 14:18:03 (UTC)
Goto Top
Ich sprach von "meinen" Daten, nicht von gewerblich genutzten Storages.
Member: Dr.EVIL
Dr.EVIL Sep 05, 2017 at 09:20:48 (UTC)
Goto Top
GERADE "Meine" Daten wären mir für ein so instabiles Storage wie ein RAID0 zu wichtig...