andy1805
Goto Top

RAID Fehler Windows Server 2012 R2

Hallo,

ohne zu sehr ins Detail zu gehen, mal eine allgemeine Frage.
Ich habe einen Server, bei dem schon seit Beginn immer wieder das RAID 1 Probleme macht.
Zuerst war das RAID onboard auf dem Board Supermicro X9dai mit SATA Platten. Es handelt sich dabei nicht um Systemplatten, sondern eine Partition auf der 7 virtuelle Maschinen laufen, ein Server 2012 R2 und 6 Windows 8, Domain Controller und Clients vdi-in-a-box. Es findet also einiges an IO auf den Disks statt.
Der Fehler äusserte sich immer so dass erst eine Platte Fehler brachte, nach dem Motto "Unrecovered Read Error" und irgendwann schloss sich die 2. Disk dem Fehler an. Dann war zwar das RAID noch immer sichtbar aber man konnte nicht mehr darauf schreiben und der ganze Server schmierte ab, sobald ein paar VMs online waren.
Wir wechselten die Disks gegen 1 TB SSD 850 Pro, machten einen Controller rein, LSI MegaRaid SAS 9240-8i und bauten alle VMs neu auf um nicht wieder den gleichen Fehler zu haben.
Sinnlos, es kam wieder das gleiche vorletztes Wochenende. Als ich die SSD aber in einen anderen PC hängte, um zu prüfen welche welche ist, stellte ich fest dass man wunderbar darauf schreiben und auch lesen konnte. Daher löschte ich das RAID, formatierte die SSD und baute das RAID neu auf. Diesmal holte ich die VMs von einem Acronis Backup zurück und es lief erst mal wieder fehlerfrei.
Nun sind wir wieder an dem Punkt "Unrecovered Read Error" und das RAID ist degradet.
Was ich noch vergessen hatte, bei den ersten Fehlern dieser Art wurden die Disk sogar alle ersetzt.
Disks wurden ersetzt, der Raid Controller wurde ersetzt, die Daten wurden neu erstellt...
Was kann noch der gemeinsame Nenner sein, dass ein RAID immer wieder auf die Nase fällt. Wir wissen bald nicht mehr was wir machen sollen.
Kann mir irgendjemand einen Tip geben in welche Richtung ich am besten suche, bzw. wir würdet ihr vorgehen, um diesen Fehler ein für allemal aus der Welt zu schaffen, möglichst ohne die ganze Hardware zu ersetzen.
Vielen Dank im voraus
Andy

Content-Key: 305789

Url: https://administrator.de/contentid/305789

Printed on: April 27, 2024 at 03:04 o'clock

Member: Kraemer
Kraemer May 31, 2016 at 13:24:56 (UTC)
Goto Top
Moin,

mein erster Gedanke war: Spannungsversorung.

Gruß Krämer
Member: MettGurke
MettGurke May 31, 2016 at 14:09:53 (UTC)
Goto Top
Habt ihr ne USV davorgeschaltet? Was issn das fürn Netzteil, weches alles mit Saft versorgt? Wenn das son China Böller ist dann kann der gerne mal Probleme machen.
Member: Vision2015
Vision2015 Jun 01, 2016 at 04:31:56 (UTC)
Goto Top
Guten Morgen,
also erst einmal möchte ich dir sagen das die Samsung 850 Pro, nix in einem Server zu suchen hat-
sondern im deinem falle die Samsung Server-SSD SM863 960GB MLC SATA...

welche Firmware hat der 9240- hast du die mal auf den neusten stand gebracht ?
... abgesehen davon ist der 9240 nich nur günstig, sonder auch das schlechteste was ihr kaufen konntet! wer hat euch beraten ?
und für SSD Raid´s ist er nicht vorgesehen!
besser wäre ein LSI 9361-4i mit BBU etc...

wenn ich deine Server config so lese, denke ich nur- kleiner server- 7 VM´s 1 Hdd- 2 SSD´s - das wird nie was werden...
ich frage erst gar nicht nach den NETZTEIL ... ICH VERMUTE 400W 30,- euro EK.

Frank
Member: Kraemer
Kraemer Jun 01, 2016 at 06:08:22 (UTC)
Goto Top
Guten Morgen,

drei Kommentare von drei Nutzern - alles haben das Netzteil im Auge. Was sagt der TO nun dazu?

Schönen Tag
Member: Andy1805
Andy1805 Jun 01, 2016 at 12:59:09 (UTC)
Goto Top
Lieber Frank

ich stimme absolut mit dir überein. Der IT Verantwortliche in der Bude hat das Gefühl er kennt sich aus und hat Hardware und Software vorgegeben.
Aber mal von dem Controller abgesehen, den haben wir erst nachträglich eingebaut (vorher war es der Onboard Intel Controller mit SATA Platten, noch schlimmer ich weiss). Daher kanns der Controller nicht sein. Wir setzen normalerweise gute Controller mit BBU und ausreichend Cache ein.
Das Netzteil ist sicher nicht redundant, sollte aber kein billiger China Böller sein und eine USV haben wir auch eine APC vornedran).
Member: Andy1805
Andy1805 Jun 01, 2016 at 13:00:00 (UTC)
Goto Top
Muss das Power Supply mal checken, aber wie gesagt USV ist vorgeschaltet.
Member: Kraemer
Kraemer Jun 01, 2016 at 13:01:51 (UTC)
Goto Top
Moin,

Netzteile können auch einfach in sofern kaputt gehen, als das diese dann keinen Totalausfall erleiden, sondern nur schlicht zu wenig Saft liefern. Außerdem kann es durchaus sein, das das Netzteil zu klein Dimensioniert ist. Gerade bei nachträglichen Änderungen an der Hardware, wird all zu oft das Netzteil vergessen.

Gruß Krämer
Member: Andy1805
Andy1805 Jun 01, 2016 at 13:09:23 (UTC)
Goto Top
Also wenn ich euch so alle höre.
Wir beziehen normalerweise unsere Server je nach Preisniveau und Kunden von HP oder Wortmann. Beide statten aber ihre Server mit vernünftigen Controllern und Platten aus. Diesen Server haben wir von einer kleinen Schweizer Bude gekauft, die wussten aber nicht was der Kunde damit vorhat.
Mein ihr tatsächlich dass eine Stromversorgung immer wieder das RAID zerschiessen kann? Auch mit vorgeschalteter BBU?
Der Server hatte um die 3'500 Euro gekostet, aber der Kunde wollte es so. Nun ist die Frage, was tun? Power Supply ersetzen, Raid Controller ersetzen? BBU dran und neue SSD? Das wird teuer...
Andy
Member: Kraemer
Kraemer Jun 01, 2016 updated at 13:12:48 (UTC)
Goto Top
Also wenn ich euch so alle höre.
Mein ihr tatsächlich dass eine Stromversorgung
Nein, ich habe schlicht keine Ahnung / Erfahrung und laber hier nur irgendwelchen Stuss zusammen!
Member: Vision2015
Vision2015 Jun 01, 2016 at 17:54:08 (UTC)
Goto Top
Zitat von @Andy1805:

Muss das Power Supply mal checken, aber wie gesagt USV ist vorgeschaltet.
äh... was willst du uns dazu sagen ? ah ich verstehe- netzteil fehlerhaft, die USV bügelt das aus...
mumpitz....
der USV ist es völlig egal wie es deinem NT geht...

frank
Member: Vision2015
Vision2015 Jun 01, 2016 at 17:55:16 (UTC)
Goto Top
Zitat von @Kraemer:

Also wenn ich euch so alle höre.
Mein ihr tatsächlich dass eine Stromversorgung
Nein, ich habe schlicht keine Ahnung / Erfahrung und laber hier nur irgendwelchen Stuss zusammen!

schön das es jemand zugibt face-smile

Frank
Member: Vision2015
Vision2015 Jun 01, 2016 at 18:09:52 (UTC)
Goto Top
Zitat von @Andy1805:

Also wenn ich euch so alle höre.
...sind deine ohren ok...
Wir beziehen normalerweise unsere Server je nach Preisniveau und Kunden von HP oder Wortmann. Beide statten aber ihre Server mit vernünftigen Controllern und Platten aus. Diesen Server haben wir von einer kleinen Schweizer Bude gekauft, die wussten aber nicht was der Kunde damit vorhat.
nun- einer schlimmer als der andere... egal- jeder dieser genannten schraubt in das blech, was du bestellst, nicht was gut und teuer ist face-smile

Mein ihr tatsächlich dass eine Stromversorgung immer wieder das RAID zerschiessen kann? Auch mit vorgeschalteter BBU?
klar... wie du an einen LSI 9240-8i eine BBU dängeln willt, bleibt mir ein Rätsel...
Der Server hatte um die 3'500 Euro gekostet, aber der Kunde wollte es so. Nun ist die Frage, was tun? Power Supply ersetzen, Raid Controller ersetzen? BBU dran und neue SSD? Das wird teuer...
nun, 3500,- netto ....sind nicht teuer- dafür bekommst du schon einen ordentlichen brot und butter server, mit LSI 9361-4i +BBU.. inclusive 3 jahre Garantie....
natürlich würde ich die komponenten alle mal testen und tauschen... was sagt der hersteller aus den schweizer alpen dazu?
schon mal logs gelesen ? was sagt das MB etc...

Frank
Andy
Member: Dr.EVIL
Dr.EVIL Jun 02, 2016 updated at 13:52:15 (UTC)
Goto Top
Bevor wir uns am Netzeil verbeissen:
Wie schaut es mit der SSD Wear Gauge auf dem Controller aus?
Ein Controller ohne dieses Feature, zusammen mit einfachen "Read Intensive" SSDs und Anwendungen wie z.B. Datenbanken, welche viele Daten schreiben, können in rel. kurzen Abständen zu solchen Fehlern führen.

Ich vermute daher den Fehler im Zusammenspiel der, nicht für den Serverbetrieb vorgesehenen SDDs, mit einem RAID Controller ohne angemessene SSD Verschleißkontrolle. (Wear Gauge)
Ein Austauch dieser Komponenten dürfte allerdings auf einen "wirtschaftlichen Totalschaden" des Systems hinauslaufen... face-confused
Member: Dr.EVIL
Dr.EVIL Jun 02, 2016 at 13:40:10 (UTC)
Goto Top
@Frank

Wir beziehen normalerweise unsere Server je nach Preisniveau und Kunden von HP oder Wortmann. Beide statten aber ihre Server mit vernünftigen Controllern und Platten aus. Diesen Server haben wir von einer kleinen Schweizer Bude gekauft, die wussten aber nicht was der Kunde damit vorhat.
nun- einer schlimmer als der andere... egal- jeder dieser genannten schraubt in das blech, was du bestellst, nicht was gut und teuer ist face-smile

Einspruch! face-wink
Markenhersteller zeichnen sich auch dadurch aus, das sie Konfigurationen die nicht funktionieren oder Probleme bereiten können, gar nicht erst anbieten, oder in ihren technischen Unterlagen auf mögliche Inkompatibilitäten hinweisen...
Desktop SSDs an RAID Controllern ohne entsprechenden Support dieser Medien wären bei den meisten mir bekannten Herstellern nicht konfigurierbar.

Ich finde 3.500,-€ jetzt auch nicht so einen "konkurenzlosen Hammer Preis".
"Entry Server" mit Funktionsgarantie und Servicepaket gibt es von fast allen bekannten Markenherstellern, da muss man nicht unbedingt "Jugend forscht" spielen und Server aus NoName Teilen zusammenpuzzeln.
Bereits beim ersten Ausfall dieser Art dürfte sich der Preisvorteil des NoName Servers relativiert haben...