Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Raid Controller meldet Fehler, HDD Diagnose meldet nichts

Frage Hardware

Mitglied: kontrast

kontrast (Level 1) - Jetzt verbinden

27.04.2010, aktualisiert 09:13 Uhr, 7275 Aufrufe, 7 Kommentare

Hallo,

Vorab:
ca. 3 Jahre alter Intel XEON Server
Intel SRCSAS144E Raid Controller
Western Digital Raptor mit 150GB
Unrecoverable medium error during recovery

ich hab ein Problem bei dem ich aktuell nicht mehr weiter komme, am Wochenende habe ich nach und nach eine HDD aus dem Raid 5 (mit Hot Spare) herausgenommen und diese ganz normal am PC mit den WD Data Lifeguard Diagnostic und Active Hard Disk Monior mehrfach geprüft und so. Dabei sind meines Erachtens nach keine nennenswerten Fehler auf allen 3 Platten aufgefallen, klar sind die Platten schon etwas gelaufen, die SMART Werte lagen aber alle im grünen Bereich und DLG hat nichts gemeldet!

Gestern schien alles noch recht gut zu laufen, nur heute spinnt der Controller komplett rum, extrem viele Meldungen "Unrecoverable medium error during recovery" auf ALLEN 3 HDDs!

Vorhin habe ich mal Data Lifeguard Diagnostic auf das Raid5 losgelassen und dort wurden dann auch tatsächlich fehlerhafte Sektoren gefunden, was bei den Einzeltest nicht der Fall war.

Spricht das nun eher dafür, dass der Controller eine Macke hat oder das alle HDDs tatsächlich eine Vielzahl an defekten Sektoren haben?


Mein Problem ist nun auch folgendes: Der Server der Probs macht ist der DC mit Unternehmensdaten und die Backups laufen in der letzten Zeit natürlich mit Fehlern durch! Ein neuer 2. Server (ENDLICH!) ist bestellt, nur das bringt mir JETZT gerade leider nichts. Ich habe keine Lust, dass der Server abraucht bevor der neue seine Funktion übernehmen kann.


Was kann ich noch tun? Wie gehe ich am besten vor?

Gruß
Mitglied: grandma
27.04.2010 um 09:24 Uhr

Spricht das nun eher dafür, dass der Controller eine Macke hat oder das alle HDDs tatsächlich eine Vielzahl an defekten
Sektoren haben?




Ja. tausche die HDD so schnell du kannst.


Gruß
omma
Bitte warten ..
Mitglied: SamvanRatt
27.04.2010 um 10:05 Uhr
Hi
die WD Diagnoistics sind leider sehr eng mit Fehlern bestückt, sprich melden auch nur wenn die HD bereits sich nicht mehr meldet. Evtl hast du Timeouts was weder im SMART noch auf der HD selbst protokolliert wird, dein Kontroller (Vermutlich ein ICP Abkömmling) merkt das aber sehr kritisch. Zum Test könntest du die DFT von Hitachi nehmen welche auch andere testen (advanced Test). Leider habe ich die letzten 15 Jahre kein Glück mehr mit WD gehabt (aber viele Hundert davon im Einsatz aufgrund der Geschwindigkeit) und bin immer wieder begeistert wie zuverlässig meine Hitachis dagegen laufen (sind in den selben Rechnern als Backup HD drinnen). Die Velociraptor ist auch mit einem 10% Grundausschuß bei uns verzeichnet...
Eine Lösung wäre (gibt einige Artikel hier dazu) mit ddrescue einen 1:1 Clone von der def HD zu ziehen, Elektronik tauschen (dein Controller merkt sonst den Tausch) und mal sehen was drescue an Lesefehlern meldete.
Gruß
Sam
Bitte warten ..
Mitglied: kontrast
28.04.2010 um 10:47 Uhr
Danke für eure Beiträge!

Habe das Problem erst einmal anders lösen können
:
Die Flut an Fehlermeldungen wg. defekter Sektoren war ein Software Bug! Ich habe gestern die Raid Console aktualisiert und den Controller neu geflashed. Es scheint als wären die defekten Sektoren nun endgültig repariert/ausgeschlossen, es kommen keine neuen Fehlermeldungen mehr.

@ SamvanRatt bisher hatte ich immer gute Erfahrungen mit WD gemacht. Die neuen Server haben aber Cheetah's drin. Ich werd weg von den Raptoren bei den wichtigen Servern! ;)

Gruß
Bitte warten ..
Mitglied: SamvanRatt
28.04.2010 um 11:18 Uhr
Hi
ich habe selbst einmal eine HD für IBM mit entwickelt (S0633 ums genau zu nehmen), bzw lassen und die war verschriehen wegen hoher Ausfälle [so rund 80% im ersten Jahr](welche aber alle wegen fehlender Kühlung und damit Temperaturen weit über 50°C verursacht wurden). Meine beiden uralt Modelle laufen/liefen bei mir immer ohne Probleme. Es kommt immer drauf an welche Serie und wie man sie betreibt. Unsere Raptoren sind einfach vom Speed notwendig aber die Ausfallsrate ist halt auch entsprechend hoch (bei 150 Rechnern mit 300Stück), was man halt über die Menge sieht. Leider findet nicht die WDDIags den Fehler sondern RAID und DFT
Gruß
Sam
Bitte warten ..
Mitglied: grandma
28.04.2010 um 15:15 Uhr
Prinzipiell sollte man schon für Raid Platten nehmen aus unterschiedlichen Chargen.
Bitte warten ..
Mitglied: SamvanRatt
28.04.2010 um 17:21 Uhr
Hi
Ich kenne es genau umgekehrt: selbe HD, selbe P/N, selbe Revision und auf jeden Fall selbe Firmware um maximale Gleichheit zu haben. Leider ist das heute selbst beim Hersteller schon schwierig das selbe eingeschickte Bauteil wieder zu bekommen; große Arrayhersteller wie Infortrend oder HP lagern die HDs am Anfang ein und verkaufen sie dann Jahre später teuer weiter. Naja seitdem die Normung in Sachen Latenzzeit, Busarbitrierung, LBA Sektorierung, ... sehr durchgreifend läuft und die Hersteller sich sogar an die Größen halten (drei 80GB HDs von zwei Herstellern und drei unterschiedliche LBA Anzahl) ist dies denke ich nur noch eine Frage der unterschiedlichen Reaktionszeiten. Das Grundkonzept der Symetrie, gerade bei R0/1/2 bliebt aber immer noch sinnig.
Gruß
Sam
Bitte warten ..
Mitglied: grandma
29.04.2010 um 09:43 Uhr
Ich meinte Produktions-Chargen PN und Revision und Firmware sollten schon gleich sein.
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(8)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Festplatten, SSD, Raid
gelöst Adaptec 6805 Raid Controller - defekt? (15)

Frage von Axel90 zum Thema Festplatten, SSD, Raid ...

Festplatten, SSD, Raid
RAID Controller mit oder ohne Cache (24)

Frage von oce zum Thema Festplatten, SSD, Raid ...

Backup
Acronis meldet Fehler per Email, sichert aber erfolgreich??? (2)

Frage von StefanKittel zum Thema Backup ...

Server-Hardware
gelöst RAID-Controller externer Anschluss (Mini-SAS) (3)

Frage von Grimrott zum Thema Server-Hardware ...

Heiß diskutierte Inhalte
Microsoft
Ordner mit LW-Buchstaben versehen und benennen (20)

Frage von Xaero1982 zum Thema Microsoft ...

Outlook & Mail
gelöst Outlook 2010 findet ost datei nicht (19)

Frage von Floh21 zum Thema Outlook & Mail ...

Netzwerkmanagement
gelöst Anregungen, kleiner Betrieb, IT-Umgebung (18)

Frage von Unwichtig zum Thema Netzwerkmanagement ...

Festplatten, SSD, Raid
M.2 SSD wird nicht erkannt (14)

Frage von uridium69 zum Thema Festplatten, SSD, Raid ...