Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Monitoring - Welche sind die wichtigsten Vitalfunktionen eines Servers

Frage Netzwerke Netzwerkmanagement

Mitglied: limean

limean (Level 1) - Jetzt verbinden

29.08.2009, aktualisiert 12:54 Uhr, 4419 Aufrufe, 5 Kommentare

Hi,

als neues Mitglied in unserem Admin-Team auf der Arbeit möchte ich das bestehende Condition Monitoring verbessern.
Alle zu überwachenden Server sollen zu ca. 99,96% hochverfügbar gehalten werden.

Heute bestehen zwar Regeln und Verfahren, wie Fehlerfälle eskaliert werden. Leider sind sie nicht sauber dokumentiert.
Ich möchte das ganze Monitoring sauber aufbauen und dokumentieren. Dabei gehe ich den Weg der kleinen Schritte.

Zuerst möchte ich mit der Festlegung der allerwichtigsten, zu überwachenden Serverfunktionen beginnen.
Im Laufe der Zeit sollen dann aus der täglichen Erfahrung heraus die Berücksichtigung und Eskalation der Fehlerfälle ausgeweitet werden.
Hintergrund ist auch der, dass durch eine Flucht von Eskalations-E-Mail der Admin nicht hypersensibilisiert wird, sodass er
nicht mehr auf die dringlichen Notifikations-E-Mails reagiert.

Ad hoc fällt mir zu den wichtigsten Serverfunktionen - sind ja eher Komponenten - ein:

- PSU-Ausfall
- Raidcontroller-Ausfall
- HDD-Ausfall
- Lüfter-Ausfall
- CPU-Temp. außerhalb der Norm

Welche Erfahrungen habt ihr gemacht? Was würdet ihr als die wichtigsten, zu überwachenden Serverfunktionen nennen.

Vielen Dank im Voraus und ein schönes WE.

Limean
Mitglied: maretz
29.08.2009 um 13:14 Uhr
du hast da die hardware beschrieben... Ich sag mal wenn die Ausfällt dann wirst du als Admin ja eh sofort was merken (idR. klingelt dein Telefon dann nämlich wie wild und jeder User erzählt dir das was nich geht - und er das aber ganz dringend und jetzt sofort benötigt!)

Ich würde viel relevanter finden die DIENSTE des jeweiligen Servers zu überprüfen... Denn wenn dir z.B. auf dem Exchange-Server die Store.exe wegnagelt dann hat die CPU relativ wenig zu tun, HDD usw. machen auch nen ruhigen. Dein Monitoring sagt also "jo, leg dich schlafen, is alles ok". Deine Exchange/Outlook-User werden dir da aber sehr schnell was anderes erzählen (vermute ich...)

Andersrum: Fliegt dir grad die CPU schon durchs Gehäuse dann wird auch sofort der Exchange stehen -> dein System sollte also sofort Alarm schlagen... (wobei ich durchaus nicht der meinung bin das nen HW-Monitoring und nen SW-Monitoring sich gegenseitig ausschliessen - ich würde beides machen)
Bitte warten ..
Mitglied: manuel-r
29.08.2009 um 17:59 Uhr
Ich konzentriere mich primär auch auf die Dienste. Es bringt mir gar nichts zu wissen, dass die CPU nur 40° hat, die n Lüfter gemächlich ihre Runden drehen und beide Netzteile Spannung bringen.
Viel wichtiger ist zu wissen, dass je Server die darauf untergebrachten Dienste ordnungsgemäß ihre Arbeit verrichten und die User in der gewünschten Geschwindigkeit bedienen. Das ist nämlich auch das einzige, was meinen Chef und die Kollegen interessiert.
Kein Mensch interessiert sich dafür, ob ich irgendwas optimiere um ein paar Prozent Rechenleistung zu sparen, das SAN besser auszulasten oder sonst was. Aber wenn ein Dienst steht merken das alle sofort und beschweren sich zu recht. Schließlich können sie nicht arbeiten.
Das heißt natürlich nicht die Hardware zu vernachlässigen - nur halt nicht primär. Bei mir ist ohnehin alles redundant und meldet, wenn eine Komponente Ausfall hat. Dann ist ausreichend Zeit zum reagieren.
Das muss natürlich nicht für jeden zutreffen. Ich hab's in der Beziehung nämlich recht einfach: Sollte einer meiner ESX Totalausfall haben ziehen die Maschinen halt auf einen anderen ESX um bis der ausgefallene wieder läuft
Bitte warten ..
Mitglied: limean
29.08.2009 um 19:43 Uhr
Hi,

vielen Dank für eure Anregungen.

Ich gebe euch Recht: Die Dienste stehen für unsere Kunden und letztlich für uns im Vordergrund.
Das Monitoring besteht aus zwei Teilen: HW- und SW-Monitoring mit zwei unterschiedlichen Tools.

Das Monitoring soll im Idealfall proaktiv sein: ich reagiere, bevor das Dach in Flammen steht.
Wenn die redundante PSU ausfällt, habe ich zwar noch genügend Zeit zum Reagieren, aber ich weiß,
dass dieser Zustand für eine Hochverfügbarkeit nicht akzeptabel ist und versuche, schnellstmöglich Abhilfe zu schaffen.

Konzentriert man sich auf die HW: fällt euch da als unbedingt meldepflichtige Ausfälle noch was ein?
Bitte warten ..
Mitglied: manuel-r
29.08.2009 um 20:02 Uhr
Wenn es rein um die Hardware geht fallen mir ein
  • CPU-Temperatur die länger als Zeit x am oberen Limit liegt
  • Sehr viele Speicherfehler
  • Ausfall einer Platte im RAID
  • Ausfall eines oder mehrerer Lüfter
  • Störungen in der Spannungsversorgung
  • Sehr hohe Lüfterdrehzahlen
Das bezieht sich aber alles nur auf Server. Es gibt ja noch reichlich mehr an Hardware, die jeweils eigene kritische Bereiche aufweist:
  • Switche
  • Router
  • TapeLibrary
  • TK-Anlage
  • Internetzugang
  • Firewall
  • und und und
Bitte warten ..
Mitglied: limean
29.08.2009 um 21:27 Uhr
Hi manuel-r,

vielen Dank für die rasche Antwort.

Es geht vorrangig um Server eines bestimmten Herstellers, der ebenso seine Monitoring-SW dafür anbietet.
Diese Software nutzen wir bereits und wollen es auch weiterhin. Deshalb zielt meine Frage hautpsächlich auf Server ab.

Zum besseren Verständnis:
Alle anderen aktiven Komponenten decken wir mit der "globalen" Monitoring-SW ab. Diese nutzen wir auch für das Software-/Application-Monitoring. Dort laufen die HW-Alarme auf - das passiert in Form von SNMP-Traps - und werden dann als E-Mail an die Admins eskaliert. Stelle ich die Server-Monitoring-SW so ein, dass alle Alarme als E-Mail bei den Admins landen, dann mülle ich uns regelrecht zu. Das hatten wir bereits. Jetzt gilt es, mit einem kleinen und wichtigen Kern anzufangen und nach und nach alle übrigen Alarme, die als erforderlich erachtetet werden. als E-Mail eskalieren zu lassen.

Wenn ich so auf meine bisherige Liste der HW-Alarme schaue, werden die von dir genannten Fälle abdeckt. Das ist schon einmal ein Pluspunkt .

Vielen Dank und eine geruuuuhsame Nacht
Bitte warten ..
Ähnliche Inhalte
Monitoring
Monitoring des Stromverbrauches
gelöst Frage von OtenMotenMonitoring4 Kommentare

Hallo liebe Forum-Mitglieder, ich stehe vor einem neuen Projekt: "Monitoring des Stromverbrauches unserer IT-Geräte" Der Stromverbrauch soll über intelligente ...

Monitoring
Monitoring Lösung
gelöst Frage von msalcherMonitoring2 Kommentare

Hey :) Möchte gerne meine Serverumgebung monitoren. Welche Möglichkeiten gibt es? Was möchte ich gerne monitoren: VMWare Esxi 5.1 ...

Monitoring
Monitoring VMware
Frage von Rabauke84Monitoring5 Kommentare

Hallo zusammen, wie der Titel schon sagst, suche ich ein gutes Monitoring-Programm für ne VDI-Umgebung VMware mit ESXi-Server 5 ...

Exchange Server
Performance Monitoring
Frage von MarabuntaExchange Server1 Kommentar

Hallo, ich habe auf einigen Servern ein Performance Monitoring eingerichtet und beginn auf 16 Uhr gesetzt. Alle bis auf ...

Neue Wissensbeiträge
Windows 10

Windows 10 Hello-Anmeldung per Foto ausgehebelt

Tipp von kgborn vor 1 StundeWindows 10

Windows Hello ist eine Funktion, um sich per Fingerabdruck-, Gesichts- oder Iriserkennung bei Windows 10-Geräten anzumelden (siehe), setzt aber ...

Perl

Perl hat heute Geburtstag: 30 Jahre Perl: Lange Gesichter zum Geburtstag

Information von Penny.Cilin vor 9 StundenPerl2 Kommentare

Hallo, auch wenn es wenige wissen und noch weniger Leute es nutzen. Perl hat heute Geburtstag. 30 Jahre Perl ...

Sicherheit

Blackberry stirbt - Keine Updates für Priv mehr

Tipp von certifiedit.net vor 9 StundenSicherheit1 Kommentar

Blackberry wird zu einer 08/15 Firma und geht wohl mehr und mehr den Weg, den HTC schon ging. Von ...

Windows 10

Autsch: Microsoft bündelt Windows 10 mit unsicherer Passwort-Manager-App

Tipp von kgborn vor 2 TagenWindows 1012 Kommentare

Unter Microsofts Windows 10 haben Endbenutzer keine Kontrolle mehr, was Microsoft an Apps auf dem Betriebssystem installiert (die Windows ...

Heiß diskutierte Inhalte
Windows Server
SCCM 2016: PXE Boot des Clients schlägt fehl
Frage von gabeBUWindows Server22 Kommentare

Hallo Zusammen Ich habe eine Testumgebung erstellt um über SCCM 2016 einen virtuellen Client aufzusetzen. Folgende Maschinen habe ich ...

Netzwerkgrundlagen
Belibiges Teilnetz einer Subnetzmaske rausfinden?
gelöst Frage von CenuzeNetzwerkgrundlagen19 Kommentare

Wundervollen Gutentag, mittlerweile kann ich Subnetting so einigermaßen, aber ein Problem habe ich noch. Netzwerkadresse und Boradcast errechnen ist ...

LAN, WAN, Wireless
WLAN Reichweite erhöhen mit neuer Antenne
gelöst Frage von gdconsultLAN, WAN, Wireless12 Kommentare

Hallo, ich besitze einen TL-WN722N USB-WLAN Dongle mit einer richtigen Antenne. Ich frage mich jetzt ob man die Reichweite ...

Windows Server
Logging von "gesendeten Nachrichten" auf Terminalservern
gelöst Frage von Z3R0C0MM4N0THiN6Windows Server10 Kommentare

Hallo zusammen, kann mir jemand auf kurzem Wege sagen ob 1) die per Task-Manager (oder damals tsadmin) an Benutzer ...