fenris-der-wolf
Goto Top

Hardware-RAID-Controller erkennt Fetplatten nicht richtig

Moin Moin,

wir haben uns zwei Server mit ICP-Vortex RAID-Controllern zugelegt.
Es handelt sich um ICP 9014RO Hardware-SCSI-RAIDS verbunden mit je 3 Fujitsu Festplatten mit 73GB.
Auf beiden Controllern ist ein RAID1 mit Hotspare konfiguriert. Auf beiden Server läuft Ubuntu Server.

Nun tritt bei beiden Servern das selbe Problem auf unabhängig davon ob das Betriebssystem schon geladen wurde oder nicht:
- Es beginnt damit das nachdem zuerst alle 3 Festplatten einwandfrei erkannt wurden, eine Festplatte aus der Konfiguration verschwindet und auch vom Controller nicht mehr gefunden wird.
- Nach einiger Zeit oder einem Reboot wird die zweite Festplatte in der RAID-Konfiguration als fehlerhaft erkannt.
- Die letzte Festplatte bleibt aber funktionsfähig und das Betriebssystem lässt sich auch vom unvollständigen RAID weiterhin starten.
- Beim Neustart braucht der RAID-Controller bei 3 angeschlossenen Festplatten ca 5Min zum Booten. Sind nur 2 Festplatten angeschlossen so dauert es nur ca 15 Sekunden.

Nun haben wir folgendes probiert:
1. Tauschen des SCSI-Kabels und des Terminators.
2. Tauschen der Anschlüsse der Festplatten Stromversorgung
3. Tauschen der RAID-Controller untereinanader
4. Tauschen einzelner Festplatten
Ergebnis: keine Änderung
5. Anschließen des Kabels an die Festplatten in umgekehrter Reihenfolge
Ergebnis: Es wird immer die am weitesten von Controller entfernte Festplatte nicht erkannt und die in der Mitte hat nach einer Weile Fehler, unabhängig von der ID.

Ich würde ja normalerweise auf das Kabel oder den Terminator tippen aber die haben wir bereits 4 mal getauscht.

Zur Hardwarekonfiguration:
Die Festplatten haben die IDs 0 bis 2 der Controller die 7.
Die Terminierung des Controllers steht auf 'Auto'. (Ansonsten gibt es nur noch 'Off')
Die gesamte übrige Hardware (Mainboard,CPU,Stromversorgung) benutzen wir auch in einem dritten Server allerdings mit einem 3Ware SATA-RAID dieser funktioniert einwandfrei.

Mir ist das Ganze ein ziemliches Rätsel oder wir haben einfach nur Tomaten auf den Augen.

Content-Key: 56953

Url: https://administrator.de/contentid/56953

Printed on: April 26, 2024 at 19:04 o'clock

Member: SteffenF
SteffenF Apr 18, 2007 at 10:17:15 (UTC)
Goto Top
Hallo,
ich bitte um nähere Angaben zu den verwendeten Fuji-Festplatten: Typ, FW-Version, write-cache ein oder ausgeschaltet, 68- oder 80-polig (SCA), wenn letzteres: im HotSwap-Rahmen an einer Backplane oder an SCA zu 68polig-Adapter ?
Allgemein:
Steckt auf dem Kabel ein aktiver LVD-Terminator oder wird etwa passiv terminiert ?
Wenn es 68polige Platten sind hilft es manchmal, auf der letzten (am weitesten entfernten) Platte TermPower einzuschalten.
Qualtät der SCSI-Kabel (meines Wissens steckt ICP/Adaptec keine Kabel dazu), wirklich U320 zertifiziert ?
Letzte verfügbare FW (Nov. 2006) auf dem Controller ?
Welcher Treiber wird verwendet ?
Ist der StorageManager installiert ?
freundliche Grüße
SteffenF
Member: fenris-der-wolf
fenris-der-wolf Apr 18, 2007 at 15:00:45 (UTC)
Goto Top
Die Festplatten haben 68polige Anschlüsse. Typ ist Fujitsu MAW 3073 NP.
Am Kabel steckt ein aktiver LVD-Terminator.
Write-Cache ist bei allen Platten meines Wissens eingeschaltet.
Was U320 zertifiziert betrifft: Jein. Ich möchte es mal so sagen: Es steht zumindest auf Kabel und Terminator drauf.
Morgen früh teste ich das Ganze noch einmal mit einem anderen Kabel.
Wenn das nicht geht werde ich den Tipp mit Termpower an der Festplatte mal ausprobieren.

Auf jeden Fall schon mal vielen Dank für die Hilfestellung!
Member: SteffenF
SteffenF Apr 18, 2007 at 16:13:44 (UTC)
Goto Top
Hallo,
der verwendete ICP ist ein sogenannter CacheController (256MB ECC onBoard). Deshalb ist auf serverspezifizierten Festplatten der WriteCache factorydefault aus - kann da nämlich durchaus zu Fehlern kommen. Der von Ihnen verwendete Typ MAW3073NP ist aber eher eine Workstationplatte (schon daran zu erkennen, daß sie einen 68poligen Anschluß hat, neuere Serverplatten kommen allgemeinhin mit 80polig SCA), und bei denen ist der WriteCache eingeschaltet.
Mit der Qualität der Kabel (siehe hier http://www.adaptec.com/en-US/_whitepapers/tech/scsi/cables_u320.htm ) und Terminatoren steht und fällt jede SCSI-Konfig. ! Früher gab Adaptec (ICP ist nach leidvollem Intermezzo bei Intel jetzt bei Adaptec) auch schon mal konkrete Hinweise, welche Kabel welchen Herstellers bevorzugt werden. Kleiner Tip: in vielen von mir betreuten Servern steckt Foxconn.
Meine Frage zum verwendeten Treiber haben Sie leider unbeantwortet gelassen: Ubuntu basiert auf Debian und dafür bietet ICP/Adaptec keine Treiber an, allerdings die LinuxSourceCodes für Kernel 2.4 und 2.6 --> auf zum fröhlichen Kompilieren face-wink
Auch die Antwort auf die Frage, ob der Storage Manager installiert ist sind Sie mir leider schuldig geblieben - anhand der Fehlerlogs hätten wir möglicherweise das Problem eingrenzen können.
Die lange Bootzeit mit drei Platten führe ich darauf zurück, daß der Controller unter Einbeziehung des Spare ein Rebuild versucht, aber wegen zu vieler Fehler aufgibt.
Viel Erfolg und freundliche Grüße
SteffenF
Member: fenris-der-wolf
fenris-der-wolf Apr 19, 2007 at 07:08:58 (UTC)
Goto Top
Ups hab' ich vergessen...
Storage Manager ist installiert und die Logs hab' ich mir auch gezogen und an ICP/Adaptec geschickt.
Interessant scheint z.B diese Stelle zu sein:
"[1091]: 18:00:12 >> [0:01:0] DomainValidate fallback set 80 MB/s [wide=1], device was 50 MB/s [wide=0]"
Genau wie Sie beschrieben haben scheint es ein Terminator / Kabel Problem zu sein.
Schade, mittlerweile habe ich 5 Kabel ausprobiert von denen 4 eindeutig als U320 verkauft wurden.
Das gleiche gilt für die Terminatoren...

Die Treiberversion ist laut ICP OK.
Member: SteffenF
SteffenF Apr 19, 2007 at 12:01:20 (UTC)
Goto Top
Hallo,
meine Empfehlung für Kabel /Terminator wäre z.B. http://www.lindy.com/de/productfolder/03/33/33177/index.php und http://www.lindy.com/de/productfolder/07/70381/index.php .
Das Fallback ist ein ziemlich eineindeutiger Hinweis auf schlechte Kabel / Terminator-Qualität, spätestens dann, wenn er auf asynchron zurückfällt face-sad (kann Sie beruhigen, der Controller meldet das Teil viel eher ab) ist Feierabend mit dem RAID.
Viel Erfolg
würde mich über positives feedback freuen (dann könnte das Thema auch mit einem grünen Haken versehen werden face-wink )
freundliche Grüße
SteffenF
Member: fenris-der-wolf
fenris-der-wolf Apr 20, 2007 at 11:37:57 (UTC)
Goto Top
Wir haben uns nach ausführlichen Konsultationen mit dem Adaptec/ICP Support. Endlich dazu durchgerungen ein Adptec-Kabel zu kaufen. Ist zwar extrem teuer aber dann haben wir endgültig Sicherheit. Wenn das Kabel eintrifft gibt's auch hoffentlich einen grünen Haken.

Ich möchte mich noch mal eindeutig bei den Forenmitgliedern bedanken für die kompetente Hilfe und auch bei den wirklich geduldigen Mitarbeitern des Adaptec-Supports. face-smile
Member: fenris-der-wolf
fenris-der-wolf May 10, 2007 at 07:10:20 (UTC)
Goto Top
Endlich ist das ,mit einer wirklich sehr langen Lieferzeit gesegnete, Kabel eingetroffen.
Halleluja es funktioniert!!!

Ich werde wohl ein längeres Gespräch mit dem Hardwarelieferanten meines ehemaligen Vertrauens führen müssen. Seltsamerweise sind nach meinem ersten Gespräch mit ihm alle SCSI-Kabel, auf seiner Webseite, die vormals als U320 gekennzeichnet waren nur noch als SCSI3 gekennzeichnet.

Nochmal vielen Dank für die kompetente Hilfe...!
Member: SteffenF
SteffenF May 10, 2007 at 18:53:19 (UTC)
Goto Top
Hallo,
vielen Dank für das FeedBack.
freundliche Grüße
SteffenF