coltseavers
Goto Top

Wie prüft man ECC RAM?

Hallo zusammen,

habe hier einen Win 2012R2-Server mit 6 Riegeln reg. ECC-RAM.

Windows ist einmal hängen geblieben, ein Blick ins Ereignis-Logbuch zeigt mehrere Einträge "Hardware-Fehler behoben" (lach), Komponente: Arbeitsspeicher.

Habe memtest 86+ 2x drüberlaufen lassen, ohne dass er was gefunden hat.

Gibt es andere Tools, die besser für reg. ECC ausgelegt sind, oder muss man bei den Dingern einfach nur noch mehr Geduld haben, da sie ja vermutlich einige Fehler selbst ausbügeln können?

Schön wäre auch ein Tool, das den betroffenen Riegel mit angibt. Bei 6 verbauten Riegeln kann es mit try and error ne Weile dauern, bis man den richtigen gefunden hat...


Vielen Dank vorab!
Gruß,
Colt

Content-Key: 335230

Url: https://administrator.de/contentid/335230

Printed on: April 23, 2024 at 18:04 o'clock

Member: Vision2015
Vision2015 Apr 14, 2017 at 09:56:46 (UTC)
Goto Top
moin..
wenn memtest 86 nix findet, kann es auch am MB liegen...
Frank
Mitglied: 108012
108012 Apr 14, 2017 at 11:33:42 (UTC)
Goto Top
Hallo,

bei einigen MBs müssen die RAM Module in einer bestimmten Reihenfolge oder in bestimmte Slots gesteckt werden, eben so
wie bei einer geringeren Anzahl an Slots im Verhältnis zu den RAM Modulen. Also hier mal ein Beispiel dazu:
- 6 Module und 6 Slots in alle Slots einen Riegel und alles funktioniert
- 6 Module und 8 Slots, dann muss eventuell in Slot 1 & 2 und 1 & 2 neben dem ersten CPU Sockel eingesteckt werden und dann
bei dem nächsten wieder in die Slots 1 & 2 und die letzten Slots bleiben frei. Macht man das nicht so, kann es zu Problemen kommen.

Das steht aber auch alles so in dem jeweiligen Handbuch des MBs drinnen und sollte dann auch so gesteckt werden!

Gruß
Dobby
Member: BassFishFox
Solution BassFishFox Apr 14, 2017 updated at 13:37:01 (UTC)
Goto Top
Hallo,

Kann das verwendete "Memtest86+" ueberhaupt ECC fehler finden?

Bei manchen MainBoards siehst Du die ECC-Fehler im BIOS und dort auch welcher Riegel es ist.
Fujitsu z.B. hat zusaetzlich noch ServerView, welches das auch noch unter dem jeweiligen OS anzeigt.

Frohe Ostern!

BFF
Member: Lochkartenstanzer
Solution Lochkartenstanzer Apr 14, 2017, updated at Apr 28, 2017 at 15:19:55 (UTC)
Goto Top
Moin,

Memtest wird normalerweise keine Fehler finden, wenn ECC ordentlich funktioniert. Du mußt daher nach dem Memtest in den BIOs-Logs nachschauen, ob weitere Fehlerkorrekturen gemeldet wurden.

Am besten vor dem Lauf die logs löschen und nach dem memtest schauen, ob neue Einträge vorhanden sind.

lks

Edith: Tipo
Member: coltseavers
coltseavers Apr 28, 2017 updated at 14:34:34 (UTC)
Goto Top
Hallo liebe Helfenden,

dank eurer Hilfe war das Problem relativ leicht zu lösen:

Das Board ist ein Supermicro X8SIE-F.
Darauf gibt es so'n BMC IPMI Überwachungsgedöns, das im HIntergrund die von euch besagten Events mitlogged.

Über den Service-LAN-Port konnte ich dann in das Webinterface, über das der Fehler dann auch direkt angezeigt wurde:
ohne titel-1 kopie


Wie man sieht, wurde direkt auch DIMM2B als Ausfall identifiziert.

(über Firefox ging das Webinterface allerdings nicht, mit dem IE ging es dann).

Also: alles gut dank eurer Hilfe! Merci!

Gruß,
Colt