quattrom-techniker
Goto Top

Prüfung von HDDs - ohne installiertes OS

Hallo,

ich arbeite im Bereich IT-Remarketing und bin hier - mal ganz allgemein ausgedrückt - für die Technik zuständig. Das umfasst das Prüfen von Servern, Storagesystemen und Netzwerkgeräten, zurücksetzen von Passwörtern und Konfigurationen und eben auch das löschen und prüfen von HDD's. Dabei ist der Vorgang wie folgt: entweder die HDD's, die wir zur Weitervermarktung ankaufen sind bereits gelöscht, oder wir löschen sie unmittelbar nach Wareneingang mit Blancco (wenn der Lieferant ein Zertifikat braucht) oder mit Killdisk.

Bevor die HDD's dann im Warenwirtschaftssystem erfasst werden, wird jede HDD auf ihren Zustand geprüft und dabei werden alle HDD's, die defekte Sektoren oder Busfehler aufweisen aussortiert und verschrottet - nicht löschbare HDD's werden geschreddert.

Die HDD's, die wir einzeln oder als Teil von Servern und Storagesystemen verkaufen, werden von uns nicht mit einem Betriebssystem installiert, sondern leer verkauft. Die unmittelbare Installation von irgendwelchen Tools auf den zu prüfenden HDD's ist also nicht möglich.

Zum Prüfen der HDD's boote ich den Server oder das Storagesystem mit einem USB-Stick auf dem entweder ein (meistens) Windows- oder ein Linux-Livesystem ist und lese danach die Smart-Daten der HDD's - wenn vorhanden - mittels HD-Sentinel aus.

Nun das Problem:
in letzter Zeit begegnen mir immer häufiger HDD's, die keinerlei Smart-Daten gespeichert haben oder nur sehr rudimentäre Daten, wie Betriebszeit und übertragene Datenmengen - besonders häufig scheint das bei Seagate-SAS HDD's im Terabyte-Bereich vorzukommen.

Ein Oberflächentest ist meistens nicht wirklich praktikabel. Ein Windows-Livesystem stürzt bei mehr als 2 gleichzeitig laufenden Oberflächentests recht schnell ab. In einem Linux-Livesystem kann ich zwar mehrere Terminalsessions starten und z.B. mit badblocks mehrere HDD's gleichzeitig mit Oberflächentests laufen lassen, aber das dauert dann mehrere Tage - was das ganze dann wieder leicht unwirtschaftlich macht.

Fragen:
Wo wird das Smart-Protokoll eigentlich gespeichert? Im HDD-Cache oder gibt es da einen eigenen Flashspeicher auf der HDD-Platine oder vielleicht in einem speziell gesperrten Bereich der HDD selbst? Oder ist das bei den HDD-Herstellern unterschiedlich?
Scheinbar schalten auch einige RAID-Controller die Smartfunktion der HDD's aus. Weiß irgendwer, ob das Smartprotokoll vielleicht trotzdem auf den HDD's gespeichert wird und, falls ja, wie man da dran kommen könnte?
Oder hat irgendjemand einen Tipp, wie man diese Prüfungen generell sinnvoller und schneller bewältigen kann?
Die Prüftools der HDD-Hersteller (Seagate, Hitachi, Samsung) scheiden übrigens auch meistens aus, weil sie entweder die Platten, die an RAID-Controllern hängen nicht direkt prüfen können, oder weil sie installiert werden müssen, was auf einen Live-System auf USB-Stick oder CD auch nicht so ohne weiteres möglich ist.

Abschließend sei gesagt, dass diese Problematik - bei uns - nicht auf einen bestimmten Server oder Storagehersteller beschränkt ist. Wir haben zwar einen gewissen Schwerpunkt auf HP, aber wir handeln genauso auch mit Fujitsu, Dell, IBM, Netapp, und allen anderen Systemen, die uns unter die Finger kommen. Wäre ja auch zu einfach, irgendwo den HP-Insight-Manager zu installeiren und damit alles zu überwachen ;)

Besten Dank im Voraus
G. Müller

Content-Key: 322637

Url: https://administrator.de/contentid/322637

Printed on: April 24, 2024 at 03:04 o'clock

Member: BassFishFox
BassFishFox Dec 01, 2016 at 22:09:20 (UTC)
Goto Top
Hallo,

Es gibt genuegend Leute, die S.M.A.R.T einfach im BIOS des PC/Servers deaktiviert haben.

Wenn die Platten an einem RAID-Kontroller haengen... Lies mal hier:

Trotzdem kann es auch bei HD-Sentinel gut passieren, dass man nur die Werte einer HDD auslesen kann. Normalerweise verweigern RAID Controller den Zugriffe auf einzelne RAID Platten und haben dafür eigene Funktionen um die Gesundheit der einzelnen HDDs zu prüfen und anzuzeigen.

http://www.hardwareluxx.de/community/f15/erledigt-s-m-r-t-werte-bei-scs ...

BFF
Member: runasservice
runasservice Dec 01, 2016 updated at 23:20:26 (UTC)
Goto Top
Zitat von @quattroM-Techniker:

Fragen:

Erklärungen und die meisten Antworten auf deine Fragen findest Du auf der folgenden (deutschen) Wikipedia Seite:

Self-Monitoring Analysis and Reporting Technology

Die weiterführenden Links sind auch ganz brauchbar. Es wird auch kurz angerissen, warum das mit Raid-Controller nicht funktioniert. Die gleiche Information zun den Raid-Controllern habe ich auch in der Form vonPassmark erhalten.

Viel Erfolg....
Member: runasservice
runasservice Dec 01, 2016 at 23:19:25 (UTC)
Goto Top
Zitat von @BassFishFox:

Es gibt genuegend Leute, die S.M.A.R.T einfach im BIOS des PC/Servers deaktiviert haben.

Das „Abschalten“ von S.M.A.R.T. in den BIOS-Einstellungen schaltet nicht die Datenerfassung, sondern nur die Warnungen bei Überschreitung der Schwellenwerte ab face-wink

MfG
Member: ChriBo
ChriBo Dec 02, 2016 at 07:27:53 (UTC)
Goto Top
Hi,
für einen Oberflächentest kannst du Blancco verwenden:
HMG infosec lower standard + 100% verify.
Schnell und effektiv
-
wg: S.M.A.R.T
1.Möglichkeit: mach bei Blancco einen Feature Request auf: integration of S.M.A.R.T checks and report.
2. Möglichkeit: schau dir mal Aiken Workbench an.
Aiken Workbench solltet als ITAD / Refurbisher problemlos erhalten, dort is ein vollständiges SMART reporting integriert welches wahrscheinlich auch per API abgefragt werden kann

Gruß
CH

Falls du mehr Info brauchst: kontaktiere mich direkt
Member: GrueneSosseMitSpeck
GrueneSosseMitSpeck Dec 02, 2016 at 12:46:47 (UTC)
Goto Top
man kann die SMART Warnung im Bios deaktivieren, aber der SMART Status der Festplatte wird mit einem spezifischen Befehl an den Controller ausgelesen und sollte Informationen liefern über die Anzahl der Betriebsstunden und anderer Faktoren, die für den Verschleiß relevant sind.

wirklich defekte Sektoren wird man mit einem Test nur sehr begrenzt finden können, und bei schreibenden Tests vermutlich garnicht, sondern nur beim wiederholten Lesen. Man kann aber die "Remappten" Sektoren auslesen bzw. durch eine Messung ermitteln.

Sowas findet man dann mit Tools, wie dem hdperf die die Geschwindigkeit beim Lesen über alle Sektoren messen. Das ist eine Kurve, die von außen nach Innen abnimmt. Sind da aber Zacken in der Kurve dann hat die Festplatte schon durch diese Selbstreparatur Bereiche, die extrem langsam sind.
Member: Lochkartenstanzer
Lochkartenstanzer Dec 02, 2016 updated at 12:57:44 (UTC)
Goto Top
Zitat von @quattroM-Techniker:

ich arbeite im Bereich IT-Remarketing und bin hier - mal ganz allgemein ausgedrückt - für die Technik zuständig

Sorry, das ich da so sagen muß, aber Wenn Du im remarketing für Technik zuständig bist, solltest Du Dich aber selbst damit auskennen oder Dein Arbeitgeber sollte dafür sorgen, daß Du entsprechende Schulungen bekommst.

Und so ein System aufzusetzen, daß automatisch die Oberflächentests durchführt ist auch kein Hexenwerk:

Einfach einen Rechner aufsetzen, der mehrere hot-swap-käfige hat. Diesen an SAS-Controller hängen und einen Job unter linux aufsetzen, der beim einschieben einer Platte dies erkennt und den Festplattenscan startet und automatisch anschließend die Platte formattiert und ein prüflog draufschreibt. Wenn schreibfehelr gefunden werden, halt den Prüfprozess abbrechen udn die Platt eals "kaputt" markieren.

Sollte das Euch "zu hoch" sein, kann Ich euch gerne ein Angebot für ein solches System unterbreiten. face-smile

lks
Member: quattroM-Techniker
quattroM-Techniker Dec 02, 2016 updated at 22:49:01 (UTC)
Goto Top
Zitat von @BassFishFox:

Hallo,

Es gibt genuegend Leute, die S.M.A.R.T einfach im BIOS des PC/Servers deaktiviert haben.

Wenn die Platten an einem RAID-Kontroller haengen... Lies mal hier:

Trotzdem kann es auch bei HD-Sentinel gut passieren, dass man nur die Werte einer HDD auslesen kann. Normalerweise verweigern RAID Controller den Zugriffe auf einzelne RAID Platten und haben dafür eigene Funktionen um die Gesundheit der einzelnen HDDs zu prüfen und anzuzeigen.

http://www.hardwareluxx.de/community/f15/erledigt-s-m-r-t-werte-bei-scs ...

BFF

Hi und danke für den Tipp,
allerdings sind mir bislang nur sehr selten Server begegnet, die es ermöglichen die Smart-Funktion im Bios zu deaktivieren / zu aktivieren. Zumindest die aktuelleren Geräte, die mit SAS arbeiten bieten derartige Schaltmöglichkeiten eher selten.

Die Aussage, dass RAID-Controller normalerweise den Zugriff auf einzelne HDD's verweigern kann ich so auch nicht ganz unterschreiben.

Ich denke diese Aussage trifft am ehesten auf ein installiertes System zu, in dem die HDD's in irgendeinem RAID-Verbund laufen. Bei den meisten RAID-Controllern kann man jedoch problemlos jede einzelne angeschlossene HDD als "RAID-0" konfigurieren und dann die Daten auslesen (funktioniert bei HP P400, P800, P410, P411, P420, Fujitsu Megaraid 3G und 6G, Dell Perc 6 und Hxx, etc). Manche LSI-Controller und auch die Fujitsu Megaraid in den Servergenerationen S7 und S8 bieten auch wieder den JBOD-Modus, der es ebenfalls ermöglicht die HDD-Daten auszulesen - falls vorhanden.

G.M.
Member: quattroM-Techniker
quattroM-Techniker Dec 02, 2016 at 23:11:06 (UTC)
Goto Top
Zitat von @ChriBo:

Hi,
für einen Oberflächentest kannst du Blancco verwenden:
HMG infosec lower standard + 100% verify.
Schnell und effektiv
-
wg: S.M.A.R.T
1.Möglichkeit: mach bei Blancco einen Feature Request auf: integration of S.M.A.R.T checks and report.
2. Möglichkeit: schau dir mal Aiken Workbench an.
Aiken Workbench solltet als ITAD / Refurbisher problemlos erhalten, dort is ein vollständiges SMART reporting integriert welches wahrscheinlich auch per API abgefragt werden kann

Gruß
CH

Falls du mehr Info brauchst: kontaktiere mich direkt

Hi,
also ganz ehrlich: Blancco taugt zum Festplatten prüfen nach meiner Erfahrung rein gar nichts!
Wir löschen zu 95 Prozent mit dem DOD5220 Standard mit dreifacher Überschreibung und die Blancco-Löschberichte geben ja auch schön Auskunft, wie viele remappte Sektoren ggf gelöscht wurden, i.d.R. mit der Meldung "Zustand: gut".
Wenn ich diese Platten dann anschließend mit HD-Sentinel auslese, finde ich trotzdem recht häufig Platten die Lesefehler oder Busfehler haben (auch wenn Blancco keinerlei remaoote Sektoren gefunden und gelöscht hat) und somit für den Weiterverkauf nicht geeignet sind.
Wir haben auch einen Lieferanten in England der explizit mit dem von dir erwähnten HMG infosec seine HDD's "prüft" und die entsprechenden Prüf-Löschberichte mitliefert. Auch dabei finde ich immer wieder defekte HDD's.

Gruß
G.M.
Member: quattroM-Techniker
quattroM-Techniker Dec 02, 2016 at 23:46:22 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:

Zitat von @quattroM-Techniker:

ich arbeite im Bereich IT-Remarketing und bin hier - mal ganz allgemein ausgedrückt - für die Technik zuständig

Sorry, das ich da so sagen muß, aber Wenn Du im remarketing für Technik zuständig bist, solltest Du Dich aber selbst damit auskennen oder Dein Arbeitgeber sollte dafür sorgen, daß Du entsprechende Schulungen bekommst.

Und so ein System aufzusetzen, daß automatisch die Oberflächentests durchführt ist auch kein Hexenwerk:

Einfach einen Rechner aufsetzen, der mehrere hot-swap-käfige hat. Diesen an SAS-Controller hängen und einen Job unter linux aufsetzen, der beim einschieben einer Platte dies erkennt und den Festplattenscan startet und automatisch anschließend die Platte formattiert und ein prüflog draufschreibt. Wenn schreibfehelr gefunden werden, halt den Prüfprozess abbrechen udn die Platt eals "kaputt" markieren.

Sollte das Euch "zu hoch" sein, kann Ich euch gerne ein Angebot für ein solches System unterbreiten. face-smile

lks

Hi,
Ironiemodus an
'Sorry, wenn ich das so sagen muss', aber wenn sich jeder in jeder Materie 100 prozentig auskennen würde, dann wäre doch ein solches Forum hier eigentlich überflüssig, oder?
Ironiemodus aus ;)

Ich bin in den Job als der berühmte Seiteneinsteiger reingerutscht. Ich schraube seid Anfang der 90er PC's selbst zusammen und habe im Jahr 2000 mal eine Ausbildung zum Systemadministrator für Windows 2000 Server gemacht. Damit war ich dann fertig, als der "Zusammenbruch der neuen Märkte" stattfand und tausende IT-Spezialisten stempeln gehen mussten. Ich habe keine Technikerausbildung im IT Bereich und habe vorher auch nie beruflich mit IT-Technik zu tun gehabt. Ich bin seid 3,5 Jahren in der Firma und seid 2,5 Jahren mach ich mehr und mehr die Technik. erst im aktuellen Jahr wurde mein Vertrag dahin gehend geändert, dass ich nun Hauptverantwortlich für die Technik bin.
Ursprünglich habe ich mal vor bald 40 Jahren eine Ausbildung zum Fahrzeugbauer im NFZ Bereich gemacht und vor 25 Jahren eine Ausbildung "Logistik für Fach- und Führungskräfte" beim FhG-IML.

Nur mal so nebenbei erwähnt ;)

Jeder wächst an und mit seinen Aufgaben und dank Google kann man eine Menge Probleme lösen, ohne 'jemanden mit Fragen löchern zu müssen'. Aber leider fehlt mir ein bisschen der Kontakt zu anderen IT-Profis und manche Dinge lassen sich halt mit direkter Kommunikation eher lösen, als mit tagelanger Suche in Google und diversen Foren.


Zu deinem Vorschlag: prinzipiell habe ich an sowas in der Richtung auch schon gedacht - ich kenn mich allerdings tatsächlich noch nicht soo gut mit Linux aus, auch da bin ich noch eher am Anfang der Lernphase. Trotzdem hat das ganze einen Haken:
Leider hat ja jeder Server- und Storagehersteller eigene HDD-Rahmen. Und nicht nur das. Wir haben ja alles mögliche an HDD's zum prüfen und löschen: SATA, SAS, Fiberchannel, FATA, SCSI (nur noch selten), und diverse Mischformen und das in 2.5 und 3.5". Also bräuchte ich eine ganze Batterie von Prüfservern oder wir müssten jemanden einstellen, der hauptberuflich HDD's umschraubt.
Meine Überlegung ging daher eher in die Richtung ein bootfähiges Linux mit entsprechenden Tools oder Scripten auf einen TFTP-Server zu legen und dieses dann über PXE zu starten, falls das geht. Aber das ist dann ein Thema für eine andere Rubrik dieses Forums, wenn es soweit ist. ;)

G.M.
Member: quattroM-Techniker
quattroM-Techniker Dec 03, 2016 at 00:03:11 (UTC)
Goto Top
Eine Sache noch: bereits in meinem ersten Posting habe ich erwähnt, dass ich immer wieder auf HDD's treffe, die diesen SMART-Modus nicht haben. (Interessanterweise ist darauf bislang keiner eingegangen).
Nun habe ich gerade gestern bei der Suche nach einer bestimmten Information über Seagate-Cheetah NS HDD's eine PDF-Datei von Seagate gefunden, die meine Verdacht, dass man S.M.A.R.T in HDD's direkt ein- und ausschalten kann bestätigt:

Zitat:
Controlling S.M.A.R.T.
The operating mode of S.M.A.R.T. is controlled by the DEXCPT and PERF bits on the Informational Exceptions
Control mode page (1Ch). Use the DEXCPT bit to enable or disable the S.M.A.R.T. feature. Setting the DEXCPT
bit disables all S.M.A.R.T. functions. When enabled, S.M.A.R.T. collects on-line data as the drive performs
normal read and write operations. When the PERF bit is set, the drive is considered to be in “On-line Mode
Only” and will not perform off-line functions.
You can measure off-line attributes and force the drive to save the data by using the Rezero Unit command.
Forcing S.M.A.R.T. resets the timer so that the next scheduled interrupt is in two hours.
You can interrogate the drive through the host to determine the time remaining before the next scheduled measurement
and data logging process occurs. To accomplish this, issue a Log Sense command to log page 0x3E.
This allows you to control when S.M.A.R.T. interruptions occur. Forcing S.M.A.R.T. with the RTZ command
resets the timer

Quelle der Datei: http://www.seagate.com/staticfiles/support/disc/manuals/enterprise/chee ...

Also kommt man bei HDD's bei denen SMART - aus welchem Grund auch immer - deaktiviert wurde, an einem Oberflächenscan scheinbar nicht vorbei, wenn man sie prüfen will.
Member: ChriBo
ChriBo Dec 03, 2016 at 18:39:04 (UTC)
Goto Top
Hi,
deine Erkenntnisse kann ich so nicht nachvollziehen und wir verwenden Blancco mengenmäßig im 6-stelligen Bereich (jährlich).

CH