wellknown
Goto Top

Lösung für Ersatz eines defekter Raid-Controllers

Hallo,

da ich nichts gefunden habe und selbst eine Lösung brauchte, hier eine kleine Anleitung für alle die vor dem gleichen Problem stehen sollten.

Nach Neustart des Servers fand dieser kein Betriebssystem mehr. Beide Festplatten eines Raid 1 gleichzeitig kaputt war sehr unwahrscheinlich.
Im Detail des Bootprozesses zeigte sich dann, das der Raid-Controller nicht mehr erkannt wird.

Möglichkeit 1, Mainboard defekt, konnte durch testweisen Einbau des Controllers in anderen Server schnell ausgeschlossen werden. Blieb nur Möglichkeit 2, Controller LSI 9690 defekt.
Nach allem was ich im Netz gefunden habe, der Megagau. Aber nicht entmutigen lassen wenn es passiert.

Zunächst wurde ein baugleicher Kontroller aus einem anderen Server ins Mainboard eingebaut. Da er erkannt wurde war klar, was zu tun ist.

  • Firmwareversion des Ersatzkontrollers muß die gleiche oder eine neuere sein als auf dem Originalkontroller, d.h., zur Sicherheit immer die neuste Firmware auf den Ersatzkontroller spielen (wenn nicht schon drauf)
  • Zur Sicherheit ein Image von einer der Platten des Raids machen, wenn mehrere Units vorhanden sind natürlich von je einer.
  • Auf keinen Fall Zuordnung der Festplatten zu Kanälen ändern !
  • Alten Kontroller ausbauen
  • Neuen Kontroller einbauen, keine Festplatten anschließen
  • Server starten
  • Raid-Kontroller Konfiguration zurücksetzen, sichern
  • Server neu starten, Raid-Kontroller konfigurieren (so denn man Infos zu den Einstellungen des alten Kontrollers hat; Fotos sind hilfreich),
  • Konfiguration sichern
  • Server herunterfahren
  • Festplatten anschließen
  • Server starten
  • Raid-Kontroller Konfiguration prüfen; sollte alle Units erkannt haben, Konfiguration sichern

Server sollte dann ohne Probleme starten. Ging zumindestens mit Windows Server 2012 R2 so.

Der Ersatz eines defekten LSI-Raid-Kontrollers durch einen baugleichen Kontroller funktioniert also (getestet bei RAID 1 !!!).:

WN

Content-Key: 387111

Url: https://administrator.de/contentid/387111

Ausgedruckt am: 19.03.2024 um 08:03 Uhr

Mitglied: Deepsys
Deepsys 20.09.2018 um 21:06:03 Uhr
Goto Top
Hallo,

danke für deine Anleitung, könnte evtl. jemanden den Kopf retten.

Allerdings vermisse ich das wichtigste, VORHER ein funktionierendes Backup haben.
Dann kannst du das in Ruhe ausprobieren, denn dabei kannst du ganz schnell alles verlieren.

VG,
Deepsys
Mitglied: wellknown
wellknown 21.09.2018 um 08:12:34 Uhr
Goto Top
… das mit dem Backup-zur-Sicherheit-im-Schrank-haben sollte klar sein.

WN
Mitglied: Penny.Cilin
Penny.Cilin 21.09.2018 um 10:19:23 Uhr
Goto Top
Hallo,

schöne Anleitung. Nur so als Erfahrungswert, das funktioniert auch bei anderen RAID-Controllern (MegaRAID, usw.) und auch bei RAID5.
Vorausgesetzt, man setzt die Platten/SSDs auch wieder so in die Slots, wie sie waren - falls man diese rausgezogen haben sollte.

In eigener Sache dazu, vielleicht kannst Du diese Punkte mit aufnehmen:
Wenn man die Möglichkeit hat via Remote Management (IBM IMM, HP iLO, Dell iDRAC, usw.) den Server zu konfigurieren, dann kann man sehr bequem alle Einstellungen, BIOS / UEFI Settings wie auch die Versionen per Screenshot und Erläuterungen dokumentieren.

Zudem ist das am bequemsten, statt im Serverraum zu arbeiten. Ja ich weiß für den Einbau des RAID-Controllers muss man vor Ort sein.
Bevor ich aber den Server wieder in die Produktion lasse, mache ich eine möglichst komplette Dokumentation.

Ich bin in der Vergangenheit sehr oft von Kollegen belächelt worden, wegen meiner Vorgehensweise. Aber die Erfahrung hat gezeigt, wenn man von der Hardware (speziell RAID Controllerkonfiguration) eine Dokumentation vorliegen hat, ist die Reparatur / der Austausch eines Controllers kein Hexenwerk.
Dies größten Problem sind die RAID Konfiguration und Releasestände.

Top, daß Du das hier veröffentlich hast - Chapeau face-big-smile

Gruss Penny
Mitglied: wellknown
wellknown 22.09.2018 um 14:03:08 Uhr
Goto Top
Bzgl. Dokumentation kann ich nur zustimmen. Habe 10 Produktiv-Server in Betreuung- kann mich mit Virtualisierung nicht anfreunden - und 1 Testsystem. Alle Server haben Boards von Supermicro und Raid-Kontroller von LSI (9690 und MegaRaid). Für alle BIOS-Einstellungen und für die wichtigsten Einstellungen der LSI gibt es "Fotodokumentationen". Und die sind 1x auf einem Server und 1x lokal gespeichert.

WN
Mitglied: holli.zimmi
holli.zimmi 24.09.2018 um 13:45:34 Uhr
Goto Top
HI Penny,


Ich bin in der Vergangenheit sehr oft von Kollegen belächelt worden, wegen meiner Vorgehensweise. Aber die Erfahrung hat gezeigt, wenn man
von der Hardware (speziell RAID Controllerkonfiguration) eine Dokumentation vorliegen hat, ist die Reparatur / der Austausch eines Controllers
kein Hexenwerk.
Dies größten Problem sind die RAID Konfiguration und Releasestände.

Das muß ich voll zustimmmen, nichts geht über eine gute Dokumentation ( auch wenn es manchmal nervt)!
Mein Problem ist, hoffentlich habe ich nichts vergessen!

Gruß

Holli