cse
Goto Top

Gedankenspiel Festplatte im Raid defekt.

Was tun wenn eine Platte im Raid defekt ist.

Hi,

glücklicher Weise hatte ich den Fall noch nie, die Hardware wurde immer vorher ausgetaucht ^^.
Aber was wäre wenn in einem Raid 1 eine der beiden Platten einen defekt hat?

So wie ich das verstehe müsste ich die Defekte ausbauen und eine Neue (am besten baugleiche) einbauen dem Kontroller sagen, dass er die alte auf die neue spiegeln soll.

Ist das soweit korrekt?

Würdet ihr euch solch eine baugleich Platte auf Lager legen um

1. im Ernstfall schnell reagieren zu können
2. um Probleme auf dem Kontroller zu vermeiden

???

Danke schon mal an alle Poster.

Content-Key: 177648

Url: https://administrator.de/contentid/177648

Printed on: April 24, 2024 at 22:04 o'clock

Member: it-frosch
it-frosch Dec 13, 2011 at 16:07:18 (UTC)
Goto Top
Hallo cse,

wenn du Hotplug Platten hast ziehst du im laufenden Betrieb die defekte Platte, steckts die neue rein und fertig.
Die Spiegelung stellt der Controller allein wieder her.

Die User werden davon auch nicht so viel mitbekommen.

grüße vom it-frosch
Member: perseues
perseues Dec 13, 2011 at 16:07:55 (UTC)
Goto Top
Hallo,

ich würde bei Ausfall einer Platte beide Platten tauschen, da die mechanische und thermische Belastung bei allen Platten gleicht ist/war und damit womöglich die andere Platte auch zeitnah abraucht. Eine Ersatzplatte ist somit nur zum Überbrücken, bis die neuen da sind. Ob sich das rechnet, mußt Du entscheiden.

Grüße perseues
Member: cse
cse Dec 13, 2011 at 16:10:14 (UTC)
Goto Top
danke euch !!!

ja ist hotplug face-smile
Member: it-frosch
it-frosch Dec 13, 2011 at 16:10:15 (UTC)
Goto Top
Hallo perseuses,

ich würde bei Ausfall einer Platte beide Platten tauschen, da die mechanische und thermische Belastung bei allen Platten gleicht ist/war und damit womöglich die andere
Platte auch zeitnah abraucht.

Aus den letzten 8 Jahren Rechenzentrumserfahrung kann ich das nicht bestätigen.

grüße vom it-frosch
Member: GuentherH
GuentherH Dec 13, 2011 at 16:11:59 (UTC)
Goto Top
Hi.

ich würde bei Ausfall einer Platte beide Platten tauschen

Na aber hoffentlich nicht gleichzeitig ;)

ich würde bei Ausfall einer Platte beide Platten tauschen

Fein, und was mache ich bei einem System, bei dem zB. 24 Platten verbaut sind? ;)

LG Günther
Member: cse
cse Dec 13, 2011 at 16:14:23 (UTC)
Goto Top
Zitat von @GuentherH:
Hi.

> ich würde bei Ausfall einer Platte beide Platten tauschen

Na aber hoffentlich nicht gleichzeitig ;)

> ich würde bei Ausfall einer Platte beide Platten tauschen

Fein, und was mache ich bei einem System, bei dem zB. 24 Platten verbaut sind? ;)

LG Günther
hehe face-smile

gute frage.
Bei einem Raid mit 2en würde ich eventuell auch beide tauschen, natürlich nicht gleichzeitig ^^, aber bei einem größeren RAID wäre das wohl zu grob.
Member: perseues
perseues Dec 13, 2011 at 16:27:28 (UTC)
Goto Top
Hallo GuentherH,

er hat aber keine 24 SCSI/SAS Platten verbaut, die in einem klimatisierten Serverraum laufen, sondern zwei im RAID 1. Da würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen Einsatz wartet, der am Schluss dann doch nicht eintritt.

Grüße perseues
Member: horst98
horst98 Dec 13, 2011 at 17:16:43 (UTC)
Goto Top
Wir versuchen im Unternehmen alle Platten zu standardisieren. D.h. alle Platten von einem Hersteller und wenn möglich der selben Größe zu verwenden. Das klappt nicht immer, weil die Platten ja von der Größe her wachsen und länger im Einsatz sind.

Und deshalb habe ich von einer eingesetzten Platte immer eine identische als Ersatz da. Mir sind auch nie Platten kurz hintereinander kaputt gegangen. Das ist statistisch auch höchst unwahrscheinlich. Noch werden Platten ja nicht so gebaut, dass sie in x Jahren kaputt gehen MÜSSEN.

Ob man sich eine Platte hinlegt hängt von ein paar Faktoren ab. Wie kritisch sind die Daten? Kann man sich einen Tag ohne Ausfallsicherheit leisten? Wie lange dauert es, bis man die Daten von einem Offline-Medium zurückgespielt hat?

Wir verfolgen die Strategie im Haus, dass wir sämtliche Rechner in Einzelteilen noch einmal bereit liegen haben. Das ist am Ende billiger als einen Wartungsvertrag mit 24h Reaktionszeit für alle Rechner vorzuhalten. Wenn man dann die Teile noch in Losen standardisiert, dann hat man im Idealfall nur einen Client- und einen Server-Rechner in Einzelteilen rumliegen. Keine zu große Investition. Hardware ist billig.

Wir gehen bei unseren geschäftskritischen Daten noch einen Schritt weiter und halten zu jedem RAID1 noch ein Hotspare-Laufwerk vor, so dass beim Ausfall einer Platte (z.B. in der Nacht) die Hotspare einspringt und die Sicherheit wiederherstellt. Damit ist ein Ausfall beider Platten mit einem Abstand von ein paar Stunden (Kopierzeit) möglich, ohne dass die Daten weg sind. Am nächsten Tag tauschen wir dann die Hotspare aus und bestellen eine Neue.

Im Moment sind wir mit dieser Vorgehensweise auch zusätzlich im Vorteil, weil Serverplatten durch die Überschwemmung in Thailand derzeit Mangelware sind und man nur noch schwer und mit Zusatzkosten welche bekommt.
Mitglied: 60730
60730 Dec 13, 2011 at 17:17:33 (UTC)
Goto Top
Moin,

Aber was wäre wenn in einem Raid 1 eine der beiden Platten einen defekt hat?

Jje nach dem - bei einem wichtigen Server an dem xxx Kollegen hängen und von dem ich "logischerweise" Backups habe - würde "ich":
  • den Server abends runterfahren
  • Platten offline tauschen - auch bei Hotplug
  • im Bios vom Raid Controller das Raid rebuilden lassen
  • via ILO einen Blick von zuhause auf den Kasten werfen
  • und den dann durchstarten, wenn der "fertig" ist.
  • Rebuild einer lahmen großen Raid1/5 x Baustelle im laufenden Betrieb geht zar auch - dauert aber 3* länger und die Kiste ist währenddessen nicht wirklich "Sie selbst"

Bei ner 148 GB Platte mit 10k und SAS gilt das natürlich nur bedingt. - Wobei da auch das Backup keinen Spass macht.

Immer frei nach dem Motto - wird die Platte nicht benutzt/die daten darauf nicht verändert und der interne Cache ausschliesslich "sinnvoll" genutzt - ratzfatz


Würdet ihr euch solch eine baugleich Platte auf Lager legen um
  • das kommt ganz drauf an - üblicherweise haben wir ja "Support Packs" - also jein...

Gruß
Member: mrtux
mrtux Dec 13, 2011 at 17:40:19 (UTC)
Goto Top
Hi !

[ot]

Zitat von @perseues:
würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen

Hast Du dir überhaupt mal die aktuellen Plattenpreise angeschaut? Sieht nicht so aus... :-P

Edit ...Und nicht nur die Preise für Serverplatten sind massiv gestiegen und das soll (wird) wohl auch noch eine Weile so bleiben...

[/ot]

mrtux
Member: Lochkartenstanzer
Lochkartenstanzer Dec 13, 2011 at 18:17:27 (UTC)
Goto Top
Üblicherweise baut man bei kritischen Infrastrukturen gleich noch eine hotspare-Platte mit ein. Sobald eine der Platten im RAID-Verbund schlappmacht, wird halt die hotspare gleich mit Daten befüllt. Dann ist die Zeitspanne in der die Redundanz weg ist, möglichst kurz gehalten. Wichtig ist natürlich, daß das System den Admin vernünftig benachrichtigt, damit das System nicht tagelang alleine vor sich rumheult, daß der Admin die Platte nicht tauscht. face-smile
Member: perseues
perseues Dec 14, 2011 at 08:00:12 (UTC)
Goto Top
@mrtux

die Frage war bei RAID1 = 2 Platten. Hier lege ich mir keine Ersatzplatte in den Schrank, die möglicherweise nie zum Einsatz kommt (totes Kapital, dass dann mit dem Server entsorgt wird). Bei 24 Platte schauts anders aus, war aber nicht die Frage. Und sollte es mal das RAID 1 zerbröseln, kaufe ich zwei (wenns denn passiert) . : -P

Grüße perseues
Member: Lochkartenstanzer
Lochkartenstanzer Dec 14, 2011 at 09:20:35 (UTC)
Goto Top
Und was machst Du in der Zeit, bis die beiden neuen Platten da sind? Server herunterfahren udn darauf warten, daß die kommen? ich weiß es ja nicht wie es bei Dir im Betrieb ist, aber bei meinen Kunden bedeutet jede Wartezeit Geldverslust. Daher wird diese Wartezeit und die Gefahr des Datenverlusts dadurch minimiert, daß man auch mal eine Festplatte "verschwendet". Die kostet egal, wie teuer sie momentan sein mag, deutlich weniger als eine Stunde länger auf den Betrieb des Servers. zu warten.

Wenn man natürlich direkt einen Händler/Distributer ums Eck hat, von dem man dann die Sachen schnell mal holen kann, ist das natürlich anders. Da hat man auch nicht mehr Zeitverlust als wenn man ins Lager geht und die Platte holt. Den Vorteil hatte ich vor 15 Jahren mal, als ich noch bei einem Systemhaus gearbeitet habe, das direkt neben einem Distributor stand. Das war vielleicht angenehm den als gut ausgestattes Lager direkt nebenan zu haben. Nur ganz selten auf Ware warten müssen. face-smile
Mitglied: 60730
60730 Dec 14, 2011 at 10:12:16 (UTC)
Goto Top
OT

eigentlich ist der Fred doch gelöst...

Ganz im Ernst - ich hab nen "Fetten" Client - dem ich auch mal - wenns garnicht anders geht als ESX laufen lassen kann.
Im SAN hab ich genauso ne Hotspare, wie in jedem Raid5.

Bei Raid1 und Servern - die "nur" 8 Platten abkönnen (ok die Geräter "sterben" aus) Verschwende ich keinen Plattenmontageplatz um eine Hotspare Raid1 und Raid5 vorzuhalten.
[/OT]
Member: N899FGG
N899FGG Dec 19, 2011 at 12:57:43 (UTC)
Goto Top
Hallo CSE,
bau in den Server immer Wechselplattenrahmen und Bandlaufwerk ein. Es gibt da solide für SSD und SATA und ... Nimm doppelt so viele wie du genötigst und tausche jeden Abend eine aus und jede Woche und jeden Monat aus und bring sie im Backup Koffer ins Nachbargebäude falls es mal brennt ist man auf der sicheren Seite. Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist. Die Ursache dokumentieren. Es gibt heute super Temperaturfühler von http://www.ipteq.de/ Technical Solution mit kleiner Platine um Temperaturspitzen im Raum, Server, Backuptapes Raum und in der Telefonzentrale zu messen. Ob die Klimaanlage läuft und falls nicht das man remote via Website eine Email bekommt und man 4 Relais hat um z.B. Remote etwas abzuschalten . Die IPR110 ist ganz gut. Robust und passt in jeden Serverschrank. Platten sind momentan teuer, warte ein paar Monate oder kauf direkt SSD. Nun bei der alten Platte würde ich einmal nachschaun ob irgendwelche Brandspuren zu sehen sind. Sichtkontrolle und falls ja die Bauteile rund herum ausstauschen. Der UTD1025C und ein SMD Lötkolben sind immer als Werkzeugkoffer bei Reichelt zu kriegen und wenn die Platte danach wieder läuft kann man die Daten noch runterholen. Die meisten Fehler sind im Platinenbereich und die kann man für ein paar Eurocent reparieren. Baugleiche Platten sind immer gut. Wenn es die Platine ist einfach die Platine ausstauschen und die Daten runterholen. Vorher die Bauteile identifizieren und mit dem Messgerät durchmessen und auf einen Zettel schreiben und bei Reichelt mitbestellen. Damit die defekte Platine wieder fertig wird. Im Ernstfall die Platte rausholen. Platine wechseln. sofort wieder einbauen und fertig. Auch beim Kontroller, Sichtkontrolle, einen in reserve ist immer gut. Auch dort die Bauteile identifizieren und bei Reichelt besorgen. Vielleicht auch mal auf die mikrocontroller.net Seite Reinschaun und den Controllerbezeichnugn oder Festplattenbezeichnung im Suchfeld eingeben. Die meisten Serein haben schon mal Produktionsfehler in Serie und wenn dort eine Platte oder Controller auftauchen die Bauteile schon mal besorgen wenn man die gleiche hat. Sind meistens nur ein paar Eurocent aber wenn man im Bedarfsfall wenn mal wieder ein Asiatisches Land unter Wasser steht hat man Vorrat und kann schnell erneuern kostengünstig.
Mitglied: 60730
60730 Dec 19, 2011 at 16:04:35 (UTC)
Goto Top
Naaabend..

Zitat von @N899FGG:
Hallo CSE,
bau in den Server immer Wechselplattenrahmen und Bandlaufwerk ein.
  • lol
Nimm doppelt so viele wie du genötigst und tausche jeden Abend eine aus und jede Woche und jeden Monat aus und bring sie im Backup Koffer ins Nachbargebäude falls es mal brennt ist man auf der sicheren Seite.
Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist.

Nunja - ich fass das mal zusammen.

  • Ein Raid1 immer durch ziehen und neueinstecken einer Platte sichern.
  • Das das auch geklappt hat immer vorm ziehen der Platte überprüfen
  • und dann mit der überprüften Platte zum Nachbarn in dessen Haus gehen, damit der es mit der Industriespionage nicht unnötig schwer hat.
  • Zwischenzeitlich die Frau/Freundin anrufen und Schluß mit der Beziehung machen, denn man(n) hat ja jetzt was zu tun.

Hat was, warum sind die ganzen anderen Antworter bis jetzt noch nicht darauf gekommen?
Das beste kommt halt immer zum Schluß.

@cse mach bitte das Schloss vor den Fred.