Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Datenverlust - was ging hier schief?

Frage Hardware Festplatten, SSD, Raid

Mitglied: siccar

siccar (Level 1) - Jetzt verbinden

31.03.2011 um 16:04 Uhr, 2891 Aufrufe, 8 Kommentare

Hallo

Folgende Situation war/ist gegeben:

Server 2008 R2 steht in einer Apotheke und dient als File- und MySQLServer in einer Arbeitsgruppe.
Daten werden auf zwei SATA Festplatten in einem RAID1(ICH8R) gespeichert.

Auf den Clients wird Apothekensoftware zur Warenbewirtschaftung und zum Verkauf eingesetzt.

Heute gegen 10:00 friert der Server ein. Als ich einen Ersatzserver ausliefere und Daten vom RAID1 rüberkopiere muß ich feststellen, daß die letzten Verkäufe aber von gestern ca. 12Uhr sind.
(ps: ich habe SICHER kein Backup genommen, sondern die aktuellen Daten). Zeitstempel der Dateien in die die Verkäufe geschrieben werden, sind auch von gestern.

Wo zum Teufel sind die ganzen Verkäufe von gestern 12 Uhr bis heute 10 Uhr, wenn die Mitarbeiter bis zum Serverabsturz ganz normal arbeiten konnten ? (Artikel aufrufen, Ware übernehmen, Artikel verkaufen).
Dazu muss ich sagen, daß die eingesetzte Software sofort nach jedem Verkauf in die Datei und in die MySQL-Datenbank schreibt und nirgends zwischenspeichert.

Sobald der Fileserver bzw. Datenbank nicht erreichbar ist, stürzen die Clients normalerweise ab bzw. geben einen Warnhinweis aus, doch hier lief für fast 20 Stunden augenscheinlich alles normal, obwohl das letztendlich nicht so war.

A. Welches Szenario hat sich hier abspielen können?
Kann es sein, daß der RAID-Controller bzw. die Festplatten, die Daten für diese Zeit nur im Cache gehalten haben und wegen einem Defekt nicht wirklich geschrieben haben. Somit lief für die Apotheke alles normal, bis der Cache voll war.

B. Wie kann man sich davor schützen. Wie kann man die aktuellen Daten redundant halten?


PS. Der Server muss schon gestern irgendetwas gehabt haben, denn ein geplanter Task (tägliche Vollsicherung), der normalerweise jeden Tag abends ausgeführt wird, wurde gestern abend zum ersten Mal nicht ausgeführt.

Bitte um eure Meinungen. Danke.
Mitglied: Firewire
31.03.2011 um 16:14 Uhr
Schätze mal es gab einen Plattenausfall und das Raid war aufgelöst.
Du hast wohl die Daten von der Platte genommen, die gestern die Grätsche gemacht hat. Versuch mal deine Daten von der 2. Platte zu kopieren.
Diese haben dann wohl den neueren Stand.

Zu der deiner Frage B:

Nen gescheiten Hardware-Raid Controller verwenden, der auch Laut gibt wenn sein Array holprig wird.

Gruß
Torsten
Bitte warten ..
Mitglied: bnutzinger
31.03.2011 um 16:27 Uhr
Also, wenn beide Platten physikalisch in Ordnung sind, dann kann es ja nur ein grober Fehler im RAID-Controller sein.
An Cache habe ich auch zuerst gedacht, das hätte aber Bestenfalls eine Lücke im Minutenbereich erklärt, sicherlich keine im Stundenbereich.

Einzige andere Alternative die mir einfällt:
gestern um 12:00 Versagt der Controller und hört auf Daten auf die Platten zu schreiben
In der Zwischenzeit werden alle Anfragen der Clients aus dem RAM (bei einer kleinen DB und einer schlanken App durchaus denkbar) oder eben aus vor diesem Zeitpunkt geschriebenen Dateien auf der Platte bedient.
Heute um 10:00 wird die erste Anfrage gestellt, die nicht aus dem RAM befriedigt werden kann, der Rechner versucht den Zugriff auf die Datei, die überhaupt nie geschrieben wurde und macht ne Grätsche.

Unwahrscheinlich aber denkbar.

Grüße
Bastian
Bitte warten ..
Mitglied: AndreasHoster
31.03.2011 um 16:52 Uhr
Fehlerhafte Systemzeit?
20 Stunden sind zwar viel, aber bist Du Dir sicher, daß der Eintrag von 10 Uhr gestern auch 10 Uhr gestern passiert ist?
Bitte warten ..
Mitglied: HubertN
31.03.2011 um 21:34 Uhr
Moin

Hast du auch beide Platten auf den Inhalt hin überprüft ?

Und zur Frage, wie man so etwas verhindern kann: Setze in jedem Server einen vernünftigen RAID-Controller ein und nicht so ein Möchtegernraid. Da ist gerade der Punkt, an dem man sicher nicht sparen sollte. Wer ein Inel Onboard-RAID, dem können die Darten eigentlich nicht so wichtig sein.

Gruß

Hubert
Bitte warten ..
Mitglied: siccar
31.03.2011 um 22:43 Uhr
An aufgelöstes RAID habe ich natürlich auch als erstes gedacht, doch ich habe beide Platten überprüft, beide haben den gleichen Stand gehabt.
Bitte warten ..
Mitglied: siccar
31.03.2011 um 22:44 Uhr
Systemzeit habe ich ebenfalls überprüft.
Bitte warten ..
Mitglied: siccar
31.03.2011 um 22:55 Uhr
Mir ist schon klar, daß Intel OnBoard RAID ein Pseudo-RAID ist.

Aber sollte sich so ein Szenario mit dem Cache so wie ich es geschildert habe abgespielt haben, dann käme das auch bei den teuersten Controllern ebenso in Frage.
Statistisch gesehen gibts es zuverlässige und weniger zuverlässige Controller und ein Defekt kann bei jedem Exemplar auftreten.

Woher habe ich die Gewissheit, daß ein "angeschlagener Controller" das macht was es machen sollte, sei das jetzt Adaptec, LSI oder Areca.
Bitte warten ..
Mitglied: HubertN
01.04.2011 um 17:20 Uhr
Normalerweise deaktiviert Windows den Schreibache selber. Zumindest auf dem Systemlaufwerk. Und einen richtigen Schreibcache hat das Onboard-RAID ja ohnehin nicht.

Wenn beide Platten den gleichen Stand aufweisen, dann hast du wohl Pech gehabt. Aus Erfahrung gehe ich aber davon aus dass der Controller seinen Spiegelsatz "vergessen" hat und deshalb die Daten nur noch auf einer Platte gelandet sind.


Gruß

Hubert
Bitte warten ..
Neuester Wissensbeitrag
Internet

Unbemerkt - Telekom Netzumschaltung!

(3)

Erfahrungsbericht von ashnod zum Thema Internet ...

Ähnliche Inhalte
CPU, RAM, Mainboards
gelöst Prozessor übertakten lief schief (6)

Frage von gamiiii zum Thema CPU, RAM, Mainboards ...

Heiß diskutierte Inhalte
Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (15)

Frage von JayyyH zum Thema Switche und Hubs ...

DSL, VDSL
DSL-Signal bewerten (13)

Frage von SarekHL zum Thema DSL, VDSL ...