Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Raid-5 Verbund immer wieder kurzzeitig nicht erreichbar

Frage Microsoft Windows Server

Mitglied: Wrikhiro

Wrikhiro (Level 1) - Jetzt verbinden

30.07.2014 um 11:20 Uhr, 1763 Aufrufe, 15 Kommentare, 1 Danke

Hi,

wir haben seit einiger Zeit Probleme mit unserem Fileserver.

Das Problem ist, dass der RAID-Verbund fast täglich für 5-10minuten nicht erreichbar ist, sprich man kommt weder lokal auf die Partition drauf noch über die Freigaben.
Der Server selbst reagiert etwas verzögert teilweise aber c:\ z.B. ist erreichbar, weshalb ich von einem Problem am Raid Controller von ausgehe.

In der Windows Ereignisanzeige und den Log-files des Controllers lässt sich leider nichts finden.

Laufen haben wir ein Raid-5 Verbund mit einem LSI Controller ( neuste Firmware ) + Windows Server 2008R2, der Server selbst ist von Supermicro.


Hat einer eine Idee ?
Mitglied: psannz
30.07.2014 um 11:23 Uhr
Sers,

Was sagt das Log im MegaRaid Manager?

Grüße,
Philip
Bitte warten ..
Mitglied: Nr60730
30.07.2014 um 11:41 Uhr
Hat einer eine Idee ?

Moin,

Schattenkopien vom Raid auf eine andere Partition des Raids?
Wird immer wieder gerne genommen.

Gruß
Bitte warten ..
Mitglied: Wrikhiro
30.07.2014, aktualisiert um 11:53 Uhr
Ist ein 3Ware Controller > 3Dm2 aber in den Logs dort ist auch nichts besonderes

außer folgendes was öfters auftritt aber nicht zur Uhrzeit vom "ausfall" der Partition

Send AEN (code, time): 0031h, 07/27/2014 05:49:28
Synchronize host/controller time
(EC:0x31, SK=0x00, ASC=0x00, ASCQ=0x00, SEV=04, Type=0x71)

http://i.imgur.com/wav6nEi.png
Bitte warten ..
Mitglied: Wrikhiro
30.07.2014 um 11:54 Uhr
Der Raid hat nur 1 Partition und VSS ist deaktiviert
Bitte warten ..
Mitglied: psannz
30.07.2014 um 12:18 Uhr
Was mit mit Media Patrols?

Sind die Ausfälle zeitlich vorhersehbar?

Was sagt das Windows Eventlog zu den Ausfallzeiten?


Liegt auf dem Controller auch das OS? Wenn nein, mal den Controller des OS Volumes überprüft? Wenn das System einfriert, etwa weil im OS Raid ne Platte vom RAID1 springt dann friert das aus User-Sicht auch deinen großen RAID samt Freigaben ein.
Auch hier: Windows Event Log sollte Aufschluss geben können.

Hatte das mal mit nem Dell R300 und angeschlossenem MD1000. Selbes Verhalten. Am Ende war es nicht - wie initial auch von mir vermutet - der PERC6/E der die RAIDs auf dem MD1000 verwaltet hat, sondern der "kleine" PERC6/ir mit seinen 2 Festplatten (R1) auf dem das OS lag. Alle 3-4 Tage ist immer dieselbe der beiden Festplatten aus dem RAID gesprungen. Platte getauscht und gut war es wieder. Aber bis der Controller sich wieder gefangen hatte dass er da die Verbindung zu einer Platte über die Wupper ging liefen gut und gern mal 3-5 Minuten ins Land, 10-15 bis alles wieder flüssig wie gewohnt lief.
Bitte warten ..
Mitglied: Wrikhiro
30.07.2014 um 12:36 Uhr
Müsste ich mal schauen ob und wann die Media Patrol checks eingestellt sind.
Ausfallzeiten sind nicht vorhersehbar, aber müssten zum Großteil im Tagesgeschäft.

Das OS liegt auf einem anderen Controller, werd ich mal überprüfen.
Das System friert in dem Sinne jedoch nicht ein, man kann weiterhin drauf "Arbeiten" nur die die Raid Partition ist nicht erreichbar und der Server reagiert teilweise nicht


Schau mir mal das OS-Raid genauer an
Bitte warten ..
Mitglied: Chonta
30.07.2014 um 17:10 Uhr
Hallo,

kannst Du zum Zeitpunk des Ausfalls per RDP auf den Server und dort auf die Partition der Freigabe ist zugreifen?
Was sagt das Monitoring über die Performance?
Geht die Leerlaufzeit vor den Ausfall schlagartig auf 0% ?
Wurde der Server vor einiger Zeit neu gestartet und der Controller hat seinen Schreibcache vergessen?

Gruß

Chonta
Bitte warten ..
Mitglied: Wrikhiro
31.07.2014, aktualisiert um 08:06 Uhr
Hi,

ja über RDP kommt man auf den Server drauf aber wie gesagt die Partition ist dann zwar noch da aber man kann nicht drauf Zugreifen.

Monitoring beschwert sich nur über den fehlenden Zugriff auf die Freigabe, die Leerlaufzeit muss ich mal beobachten.
Der Server wurde mehrmals neugestartet Writecache is laut 3dm2 jedoch an.


Die zwei OS SSDs sind an unterschiedlich schnellen Sata ports angeschlossen ( 1x 6Gb ; 1x 3Gb )
Bitte warten ..
Mitglied: Chonta
31.07.2014 um 08:33 Uhr
Hallo,

wenn Du per RDP noch auf den Server rauf kommst, dann ist das System auch nicht eingefrohren.

Wenn Du veruchst in der RDP Sitzung auf die Platte zuzugreifen, kommt dann eine Fehlermeldung oder dauert es nur ewig bis man rauf kommt?

Da ne Hostpare drins ist, sollte die wenn eine eine Platte das Problem verursacht, diese durch die Spare getauscht werden. Deswegen würde ich sagen di ePlatten sind ok.
Zu prüfen ob das Dateisystem einen Fehler hat, kann nicht schaden. Wenn Dateien nicht gelesen werden können, und mehere Versuchen auf die Datei zuzugreifen, kann sich das ähnlich deinem Problem auswirken.
Der Controller selber oder das Kabel kann auch was weg haben.

Vor allem prüfen was perfmon zur Physikalischen Datenträger Warteschlange (rw), Lerlaufzeit und Disktime sagt.
Was für Dienste ausser Fileserver stellt der Server noch bereit?

Gruß

Chonta
Bitte warten ..
Mitglied: Wrikhiro
31.07.2014 um 09:58 Uhr
Jup, Server läuft wie gesagt weiter nur die Raid Partition ist nicht erreichbar.
Fehlermeldungen tauchen keine auf man kommt nicht auf den Raid drauf, erst wenn sich das ganze wieder fängt und man auch über die Freigaben draufkommt

Was würdest du empfehlen für ein Dateisystemcheck ? oder reicht da chkdsk /f ( mit r ?)


Hab jetzt ein Auge auf den Graphen, gibt öfters kleinere und größere Ausbrüche ich behalts mal im Auge
http://i.imgur.com/WWKL8it.png

Dienste laufen keine, ist nur ein reiner Fileserver

danke schonmal!
Bitte warten ..
Mitglied: Chonta
31.07.2014 um 10:10 Uhr
Hallo,

es wird im Forum nicht gerne gesehen, wenn die Bilder extern liegen, also bitte hier reinstellen.

Die Zeitspanne ist komisch:du fängst bei 09:53:10 an dann um 09:54:30 gehts los und dann wechselt der von 09:54:40 auf 09:53:xx ??
Macht der Server Zeitsprünge?

Du hast leider den Logischen Datenträger genommen und nicht den physikalischen. Aber auch der logische zeigt immer wieder vollauslastung für Lese und Schreibzugriffe.
War die Aufnahme von nem Zustand wo nix ging oder wo noch alles normal war?

Ein Langzeitmonitoring wäre für dich von Interesse (MuninNode und Munin z.B.)
Läuft auf dem Server auch ein Virenscanner der jeden Zugriff scannt?
Wieviele Benutzer hast Du?
Gibt es Verzeichnisse in der Freigabe mit vielen klienne und großen Bildchen und die Benutzer gehen immer mit Filmansichtexplorer da rein?
Oder wird auch mit Servergespeicherten Profilen gearbeitet und Ordnerumleitungen die auch auf dem Fileserver liegen?
Es gibt viele die Komopieren Daten aus einer Freigabe auf den Desktop und bearbeiten die Da und speichern die danach wieder hoch, weil Desktop ist ja nicht auf dem Server...

Gruß

Chonta
Bitte warten ..
Mitglied: Wrikhiro
31.07.2014, aktualisiert um 11:55 Uhr
Hi,

die Sprünge kommen vom Graphen selbst die Systemzeit stimmt.

Habs umgestellt auf Physikalisch, die Warteschlange gehen teilweise Immernoch bis zur Grenze ( 1500 ), der Screenshot war vom Normalbetrieb.
http://i.imgur.com/oypTP6R.png ( sorry seh keine Option hier um Bilder hochzuladen )

Nutzen Nagios/Check_MK zu Überwachen der Server, Virenscanner läuft keiner auf dem Fileserver momentan, Benutzer knapp 300
Liegen unterschiedliche Dateien auf dem Server aber auch viele Bilder, die User nutzten die Standard Detail Ansicht vom Explorer

Ja wir benutzen Server gespeicherte Profile ( werden auf einem anderen Server abgelegt ) der Desktop liegt auch auf dem einem Fileserver und nicht lokal
Bitte warten ..
Mitglied: Chonta
31.07.2014 um 12:09 Uhr
Hallo,

nagios ist aber nicht zur Performancedatenüberwachung geeignet, bzw nicht so gut.
Hast Du schon Checks für Lehrlaufzeit Schreib und Lesewarteschlange?
Wenn nein einrichten.
Und auch einen Check der prüft wie ausgelastet die Nic ist.

Da kein Virenscanner da ist, Controller, Kabel oder ein Benutzerverursachtes Problem. (300 Benutzer sind viel und wenn da auf einmal 50 auf unterschidliche Freigaben zugreifen und dann 500 kleine und große Dateien runterladen wollen und und und.
Die Anzahl der Verbindungen zum Fileserver checken.

Gruß

Chonta
Bitte warten ..
Mitglied: Wrikhiro
31.07.2014 um 12:38 Uhr
Hey,

NIC Bandbreite+Pakete+Errors werden überwacht ( war z.B. gestern wo es passiert ist im grünen Bereich )
Für die HDDs werden nur die I/Os überwacht, ich schau mal das ich ein check für die Warteschlange auftreibe.
Aber bei einer hoher Warteschlange sollte trotzdem der RAID verfügbar sein ( wenn auch langsam und nicht komplett unerreichbar für mehrere Minuten oder ? )

Dank dir
Bitte warten ..
Mitglied: Chonta
31.07.2014 um 13:10 Uhr
Hallo,

also, wenn die Leerlaufzeit auf 0% ist und Warteschlangen für lesen und schreiben dann ist die Platte dicht. Und alle Anfragen laufen dann auf Timeout.
Z.B. wenn da jemand der Meinung ist ich suche Datei xyz aber ich hab keine Peilung wo die ist, ach ich durchuche mal die Freigabe bzw das Laufwerk X dann werd ich die finden.
Das der dann mal eben den Server lam legen kann ist dem nicht bewusst.
IO wird die Platte auch on mass haben, aber jeder der auch mal was will, kommt in die Warteschlange und dan irgendwann timeout.

Du kannst ja mal beim nächsten Problem das Netzwerkkabel ziehen und dann den Benutzern die als erstes jammern über die Schulter schauen , oder dem der garnicht jammert.

Gruß

Chonta
Bitte warten ..
Neuester Wissensbeitrag
Humor (lol)

Linkliste für Adventskalender

(3)

Information von nikoatit zum Thema Humor (lol) ...

Ähnliche Inhalte
Festplatten, SSD, Raid
M.2 PCIe 3.0 x4 im Raid 1 Verbund (Samsung Pro 950) (3)

Frage von lord-icon zum Thema Festplatten, SSD, Raid ...

DNS
gelöst Sophos UTM9 - FTP nur über IP erreichbar (4)

Frage von PronMaster zum Thema DNS ...

SAN, NAS, DAS
Storage RAID LUN Konfiguration - Wie macht ihr es (4)

Frage von Marco-83 zum Thema SAN, NAS, DAS ...

Netzwerke
gelöst Manche Websites nicht erreichbar (9)

Frage von cyber40014 zum Thema Netzwerke ...

Heiß diskutierte Inhalte
Windows Server
DHCP Server switchen (25)

Frage von M.Marz zum Thema Windows Server ...

SAN, NAS, DAS
gelöst HP-Proliant Microserver Betriebssystem (14)

Frage von Yannosch zum Thema SAN, NAS, DAS ...

Grafikkarten & Monitore
Win 10 Grafikkarte Crash von Software? (13)

Frage von Marabunta zum Thema Grafikkarten & Monitore ...

Windows 7
Verteillösung für IT-Raum benötigt (12)

Frage von TheM-Man zum Thema Windows 7 ...