noksukao
Goto Top

Wann HDD austauschen

Moin,

ich habe hier diverse HDDs mit bereits ersetzten Sectoren zwischen 20 und 160 (Raw Value). Wann ersetzt ihr eure HDDs? Orientiert ihr euch am Raw Value oder am Value? Ein Serverlieferant gab mir die Empfehlung,
die Platten nach 60 ersetzten Sektoren zu tauschen.

Schönen Tag

NokSuKao

Content-Key: 232274

Url: https://administrator.de/contentid/232274

Printed on: April 24, 2024 at 08:04 o'clock

Member: wiesi200
wiesi200 Mar 11, 2014 at 07:22:39 (UTC)
Goto Top
Hallo,

ich bin da ehrlich gesagt relativ faul. Immer dann wenn mir der Raidcontroller ne E-Mail schreibt er will ne neue Platte haben.
Member: killtec
killtec Mar 11, 2014 at 07:25:47 (UTC)
Goto Top
Hi,
kann mich da nur @wiesi200 anschließen. Warum sollte ich unnötig Geld raus werfen? Natürlich sagt der Lieferant dir das, der will ja Verkaufen. Wenn du ein ordenliches Backup hast, ist doch alles prima.
Warte bis die Platte die Gretsche macht und tausch sie erst dann aus.

Gruß
Member: NokSuKao
NokSuKao Mar 11, 2014 at 07:26:26 (UTC)
Goto Top
Moin,

so hab ich es bisher auch gemacht, aber jetzt habe ich mehrere Server unterschiedlicher Hersteller, bei denen fast bei jeder HDD Sektoren ersetzt wurden und
da muss ich dann unter Umständen früher reagieren, nur wann?

NokSuKao
Member: NokSuKao
NokSuKao Mar 11, 2014 at 07:33:25 (UTC)
Goto Top
Zitat von @killtec:

Hi,
kann mich da nur @wiesi200 anschließen. Warum sollte ich unnötig Geld raus werfen? Natürlich sagt der Lieferant
dir das, der will ja Verkaufen. Wenn du ein ordenliches Backup hast, ist doch alles prima.
Warte bis die Platte die Gretsche macht und tausch sie erst dann aus.

Gruß

Moin,

nein beim Lieferanten bekomme ich die HDD im Rahmen der Gewährleistung oder Service-Vertrages ohne Kosten ersetzt.

NokSuKao
Member: Deepsys
Deepsys Mar 11, 2014 at 07:55:49 (UTC)
Goto Top
Zitat von @wiesi200:
ich bin da ehrlich gesagt relativ faul. Immer dann wenn mir der Raidcontroller ne E-Mail schreibt er will ne neue Platte haben.
Und ich habe mich schon gefragt, ob ich das so schreiben kann face-smile

Ja, wir machen es auch so.
Member: Lochkartenstanzer
Lochkartenstanzer Mar 11, 2014 at 08:22:03 (UTC)
Goto Top
Zitat von @NokSuKao:

ich habe hier diverse HDDs mit bereits ersetzten Sectoren zwischen 20 und 160 (Raw Value). Wann ersetzt ihr eure HDDs? Orientiert
ihr euch am Raw Value oder am Value? Ein Serverlieferant gab mir die Empfehlung,
die Platten nach 60 ersetzten Sektoren zu tauschen.

Moin,

ich empfehle meinen Kunden die Platten dann auszutauschen, wenn es gerade "paßt". Wenn eine Platte anfängt Sektoren zu ersetzen, ist heißt das, daß der Alterungsprozeß begonnen hat. Ob man nun die etwas früher oder später austauscht, ist eine Frage des Sicherheitsbedürfnisses. und wieviel Geld man "übrig" hat.

Mit dem Austauschen zu warten, bis die Platte die Grätsche macht oder das RAID sagt, es will eine neue Platte haben, ist meines Erachtens nur für unkritische Anwendungen geeignet, denn meistens passiert das genau dann, wenn man es überhaupt nicht brauchen kann und mit einem degraded Array weiterzuarbeiten ist meistens kein Spaß, abgesehen von Risiko des potentiellen Datenverlustes während des Rebuilds.Ich empfehle daher meinen Kunden meist, vorzeitig eine Ersatzplatte bereitzuhalten und bei einer Häufung von Smart-Fehlern ein geschickt gelegtes "Wartungsfenster" einzubauen, um das Rebuid in unkritische Phasen zu legen. Dann erwischt einen das nicht auf "kaltem Fuß". Das gilt selbst dann, wenn man ein hot-spare hat, weil der Rebuild trotzdem erfolgen muß. Und die "vorzeitig" ausgetauschte Platte kann danach immer noch gute Dienste als Datenmüllhalde für unkritische Daten herhalten.

lks

Sofern man ein RAID6 o.ä hat, bei dem zwei Platten ausfallen können, ist das zwar weniger kritisch, aber ich habe es bei einem Kuden erlebt, daß innerhalb einer halben Stunde zwei Platten desselben Raids (5 mit hot-spare) ausgefallen sind. Dann hat dann auch das hot-spare nichts mehr geholfen, weil der rebuild nicht schnell genug ging, bevor die zweite Platte ausfiel. Wohl dem, der ein (aktuelles) Backup hat. face-smile
Member: it-frosch
it-frosch Mar 11, 2014 at 08:38:18 (UTC)
Goto Top
Hallo NokSuKao,

bei Serverplatten tausche ich sofort aus wenn der RAID Controller meckert, bzw. E-Mails schickt. face-wink

Bei privaten Desktop Platten würde ich die Platte genau beobachten, sobald sie die ersten ausgetauschten Sektoren hat.
Bleibt die Anzahl stabil, dann würde ich sie weiter verwenden, nimmt sie hingegen zu wird die Platte ausgetauscht.

Obwohl ich bei uns immer nur Desktop/Notebook Festplatten in die Hand bekomme die schon mehrere ausgetauschte Sektoren haben.
Die werden dann sofort getauscht da der Techniker ja weiter arbeiten will.

grüße vom it-frosch
Member: it-frosch
it-frosch Mar 11, 2014 updated at 08:42:15 (UTC)
Goto Top
@Lochkartenstanzer

Mit dem Austauschen zu warten, bis die Platte die Grätsche macht oder das RAID sagt, es will eine neue Platte haben
Ich bin bisher immer davon ausgegangen, dass der Raidcontroller die SMART Fehler der Platten meldet.
Wie soll ich denn bei einer MSA, EVA oder EMC die SMART Werte der einzelnen Platten prüfen?

Ich glaube, ich habe da ein Verständnisproblem. face-wink

grüße vom it-frosch
Member: wiesi200
wiesi200 Mar 11, 2014 at 08:52:05 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:

> Zitat von @NokSuKao:
>
> ich habe hier diverse HDDs mit bereits ersetzten Sectoren zwischen 20 und 160 (Raw Value). Wann ersetzt ihr eure HDDs?
Orientiert
> ihr euch am Raw Value oder am Value? Ein Serverlieferant gab mir die Empfehlung,
> die Platten nach 60 ersetzten Sektoren zu tauschen.

Moin,

Das gilt selbst dann, wenn
man ein hot-spare hat, weil der Rebuild trotzdem erfolgen muß. Und die "vorzeitig" ausgetauschte Platte kann
danach immer noch gute Dienste als Datenmüllhalde für unkritische Daten herhalten.

Die Hot-Spare sollte ja eigentlich schon einschreiten bevor die Platte tatsächlich ausgefallen ist eben das es keine solchen Probleme gibt sobald eine Platte ausfällt.

Hat mir auch mal ein EMC Techniker so bestätigt.
Member: Deepsys
Deepsys Mar 11, 2014 at 09:25:50 (UTC)
Goto Top
Zitat von @it-frosch:
Ich bin bisher immer davon ausgegangen, dass der Raidcontroller die SMART Fehler der Platten meldet.
Wie soll ich denn bei einer MSA, EVA oder EMC die SMART Werte der einzelnen Platten prüfen?
Das hat unser IBM SAN letztens auch gemacht (Predict failure hieß das), also bevor die Platte ausgefallen ist.

Aber ob das jeder RAID-Kontroller so macht???
Member: it-frosch
it-frosch Mar 11, 2014 at 09:45:46 (UTC)
Goto Top
@Deepsys,

Aber ob das jeder RAID-Kontroller so macht???

Ja, das ist die Frage. Vielleicht meldet sich dazu LKS noch mal.
Weil wir gerade beim Thema waren, habe vorhin gerade wieder eine "rote" Platte gewechselt.

EVA muss wohl mitgelesen haben. face-wink

grüße vom it-frosch
Member: Lochkartenstanzer
Lochkartenstanzer Mar 11, 2014 at 10:44:01 (UTC)
Goto Top
Zitat von @it-frosch:

@Deepsys,

> Aber ob das jeder RAID-Kontroller so macht???

Ja, das ist die Frage. Vielleicht meldet sich dazu LKS noch mal.
Weil wir gerade beim Thema waren, habe vorhin gerade wieder eine "rote" Platte gewechselt.

ich hatte in meine "Suopporterleben" den ein oder anderen RAID-Controller, der mir erst als die Platte ganz ausfiel sagte, daß sie nicht mehr geht. face-sad

Und ich hatte auch RAID-Controller in den Fingern, bei denen man die SMART-Werte mit einem Tool auslesen konnte, obwohl das RAID in Betrieb war. Allerdings kann ich nicht mehr nachvollziehen, welche das waren.

Bei dem o.g. Kunden kontne ich letztes Jahr nachvollziehen, daß in seinem RAID5 morgens eine Platte ausfiel und der Controller mit dem hot-spare angefangen hat einen rebuild zu machen, als dann plötzlich die zweite Platte über den Jordan ging. es waren 6 baugleiche Platten verbaut (weiß nicht mehr welche), die ein RAID5 mit hot-spare gebildet hatten. Zum glück war die Nacht vorher das Vollbackup noch gelaufen. Offensichtlich haben die Platten vorher keine Anzeichen gezeigt, die sich in den smart.Werten niedergeschlagen haben.

lks
Member: ITSpycher
ITSpycher Mar 11, 2014 at 21:31:30 (UTC)
Goto Top
Aus diesem Grund versuche ich Platten verschiedener Hersteller zu verwenden. Oder etwas ältere und neuere zu mischen um nicht chronologisch vom Produktionsband gelaufene Platten zu verwenden. So hoffe ich, dass die "Mikrofehler" nicht gleichzeitig zuschlagen...
Member: Lochkartenstanzer
Lochkartenstanzer Mar 11, 2014 updated at 22:24:24 (UTC)
Goto Top
Zitat von @ITSpycher:

Aus diesem Grund versuche ich Platten verschiedener Hersteller zu verwenden. Oder etwas ältere und neuere zu mischen um nicht
chronologisch vom Produktionsband gelaufene Platten zu verwenden. So hoffe ich, dass die "Mikrofehler" nicht
gleichzeitig zuschlagen...

Das Dumme ist nur, daß man nicht immer rechtzeitig Einfluß darauf nehmen kann, sei es, daß die Geräte schon vorher vorhanden sind oder man genau die aus einer Produktionscharge bekommt, auch wenn man bei verschiedenenen Händlern bestellt.

lsk
Member: ITSpycher
ITSpycher Mar 11, 2014 at 23:14:14 (UTC)
Goto Top
Leider zu wahr... Darum versuche ich es halt wenn möglich.
Member: miscmike
miscmike Mar 17, 2014 at 09:19:31 (UTC)
Goto Top
@killtec : Ähhmm - schonmal was von proaktivem Handeln gehört ? (naja, und von deutscher Rechtschreibung ?? - "gretsche" ?!?!).
Du schnallst Dich doch im Auto sicher auch nicht erst an, nachdem Du vor den Baum gefahren bist ?
Ich nehme an, hier geht es um Server - deshalb kann man ganz sicher nicht auf einen Plattendefekt warten !!

Vernünftiger Raidcontroller, der regelmäßig prüft, wenn der was zu meckern hat : Platte raus, neue rein. Auch wenn die betreffende Platte noch nicht ganz defekt ist. Ich denke einen Serverausfall - um dann erst ein Backup zurückzuspielen - kann sich kaum jemand leisten...
Member: miscmike
miscmike Mar 17, 2014 updated at 09:22:00 (UTC)
Goto Top
@Lochkartenstanzer : Jawoll - genau so und nicht anders !!!
Member: killtec
killtec Mar 17, 2014 at 13:23:09 (UTC)
Goto Top
Hi,
wir haben einen Wartungsvertrag mit dem Hersteller. Nach 4h ist unsere Storage spätestens wieder voll da. Die hat auch Reserverplatten (Hot Spare) eingebaut. Die Platten sind auch nicht alle gleich vom Alter.
Wir arbeiten nicht mehr mit Platten im Server ;)
Der Controller der Storage meldet uns auch Probleme. Von daher, alles prima face-smile
Aber stimmt schon. Wenn man die Möglichkeit hat, warum denn nicht die HDD vorher tauschen.

Das mit der Tipperei liegt am schnellen Tippen ;)

Gruß