chrisschmitt93
Goto Top

Shutdown Prozedur nach einem Stromausfall - USV

Hallo Leute ,

wir müssen derzeit für die Schule ein Projekt in einer für jedermann bekannten Firma ( die ich aus Datenschutzgründen nicht nennen darf ) einen Shutdown Prozedur erzeugen, womit sich alle Server in richtiger reihenfolge Herunterfahren.

Gegben sind ca. 200 Server ( Win & Linux ) die alle per USV an einem Rechner angeschlossen sind der sozusagen lauscht.

dieses "Script" das wir schreiben bzw. erstellen sollen, soll die Stromausfälle aufnehmen und ggf. wenn es nicht nur eine leichte Störung im Stromnetz war ( ca. 5min ) die Server in der abhängingen reihenfolge herunterfahren.


Es wäre sehr nett von euch, wenn ihr Vorschläge für die Realsierung geben würdet. Welche Tools man am besten benutzt etc.


Unser Thema :

Sicherstellen eines kontrollierten Verhaltens der IT-Systeme und –Komponenten bei Ausfall der Energieversorgung.
Durch logische und / oder IT-technische Abhängigkeiten ist ein simples, z.B. durch eine alphanumerische Reihenfolge vorgegebenes, Herunterfahren der Systeme und Komponenten nicht möglich. Es muss vielmehr sichergestellt werden, dass die o.g. Abhängigkeiten berücksichtigt und dahingehend der Shutdown-Prozess der gesamten Umgebung herbeigeführt wird.


Projektbeschreibung

Die beiden baulich getrennten Datacenter werden über zwei unabhängige USV-Anlagen versorgt. Die Kapazität der USV-Anlagen ist selbstverständlich endlich und kann die Energieversorgung nur über einen verhältnismäßig kurzen Zeitraum von maximal 30 Minuten gewährleisten. Bei der Gefahr eines Ausfalls der Energieversorgung über einen längeren Zeitraum hinaus müssen die IT-Systeme und –Komponenten in einen kontrollierten Zustand überführt werden, um einen größeren Schaden zu verhindern, um z.B. Inkonsistenten bei Datenbanken zu vermeiden.

Ziel ist es, zwei getrennte, voneinander unabhängige Systeme zu etablieren, die es ermöglichen, den Status der jeweiligen USV-Anlage zu erfassen und abhängig von diesem und vom Ablauf einer definierten Zeit und Reihenfolge die IT-Systeme und –Komponenten kontrolliert auszuschalten. Die Reihenfolge ergibt sich nicht alphanumerisch sondern basiert auf einem logischen und / oder IT-technischen Hintergrund.
Als einfaches Beispiel sei hier genannt:
VM hängt ab von ESXi-Server hängt ab von Storagesystem und Netzwerkkomponente. Als erstes muss hier in dem Beispiel die VM, dann das ESXi-System und zuletzt das Storagesystem und die Netzwerkkomponente heruntergefahren werden.
Aus dem gleichen Grund ist auch die klassische Vorgehensweise, alle Systeme detektieren selbst den Energieversorgungsstatus und entscheiden individuell, nicht anwendbar.
Zusätzlich sollten die Systeme, die von dem kontrollierten Shutdown-Prozess berücksichtigt werden müssen, dynamisch erfasst werden, tagesaktuell reicht hier aus.

Content-Key: 237129

Url: https://administrator.de/contentid/237129

Ausgedruckt am: 29.03.2024 um 05:03 Uhr

Mitglied: Snowman25
Snowman25 05.05.2014 um 11:20:32 Uhr
Goto Top
Hallo @chrisschmitt93,

normalerweise hat man auf jedem Server einen Client der auf SNMP-Events von der USV-Anlage lauscht.
Die USV schickt ein SNMP-Event an eine vorkonfigurierte Broadcast-Gruppe sobald Unregelmäßigkeiten auftreten.
Der Client wird normalerweise so konfiguriert, dass ein paar Minuten nach einem Stromausfall der Rechner heruntergefahren wird.
Die Verzögerung ist wichtig, da die Systeme nicht heruntergefahren werden müssen, wenn anach 2-3 Minuten wieder Strom da ist.

Auf den Clients können unterschiedliche Zeiten eingestellt werden, was eine kontrolliert geordnete Reihenfolge ermöglicht.
Auch können bestimmte Skripte vor der Herunterfahren ausgeführt werden. Diese würden die VMs eines ESXi-Systems herunterfahren, dann die zentralen Dienste beenden und anschließend den Shutdown durchführen.
"Bessere" Systeme haben dann noch einen Master-Server, welche die Clientkonfigurationen speichert und verteilt und damit eine zentrale Verwaltung ermöglicht.

An beiden Orten lässt sich das gleiche System nutzen.

Gruß,
@Snowman25