vburak
Goto Top

APC Smart-UPS - Diverse Fragen bzgl. Batterie und Konfiguration

Hallo,

nach wiederholendem Stromausfall beim Kunden habe ich Zweifel, dass die Konfiguration der USV richtig ist.
Um es kurz zu fassen: der ein oder andere Server hatte beim Start die Meldung gebracht, das er unerwartet heruntergefahren wurde.
Das bedeutet, ein ordentliches Herunterfahren von der USV hat nicht funktioniert.

Genutzt wird eine APC Smart-UPS 2200 mit Batterie aus der Auslieferung von 2013/2014 und inklusive Network Management Card 2. Angeschlossen sind 5 Server und 2 Cores Switches.
(Nur) 2 Server haben ein redundantes Netzteil, welche zusätzlich direkt an der Steckdose angeschlossen sind.
Die Last beträgt ungefähr 20-22%, das entspricht ca. 400 Watt. Laut des Laufzeitgraphen sollte das 44-46 Minuten betragen.

Inzwischen habe ich die gesamte Firmware und Software von APC NMC2 und des PowerChute Network Client 4.2 auf aktuellen Stand gebracht.
Die Firmware des NMC2 ist nun 6.5.6 und vom PCNS Client 4.2.

Zum Verständnis, wie der ganze Ablauf in einem Stromausfall ist, habe ich mich an verschiedenen Stellen informiert.
Zum einen wird sehr detailliert die zwei Methoden eines Shutdowns in einem Blog-Eintrag beschrieben:
https://www.stevejenkins.com/blog/2013/07/howto-configure-low-battery-du ...
Dazu noch die Doku von APC selbst, allerdings gibt es trotzdem noch die ein oder andere Unklarheit. Zu meinen Fragen:

  • Wann wechselt ihr die Batterie einer USV? Normalerweise würde ich es wechseln, wenn die USV Bescheid gibt. Ich konnte jetzt aber feststellen, dass die Batterie wohl nicht mehr die ursprüngliche Laufzeit einhalten kann. Wie gesagt, sollte bei der oben genannten Last die Batterie 44-46 Minuten durchhalten. In der Konsole steht aber inzwischen 20-25 Minuten obwohl 100% aufgeladen ist. Sollte man hier über ein Wechsel nachdenken?
  • Der PCNS unterstützt Optionen für Hyper-V Nutzung. Dabei werden verschiedene PowerShell Skripte genutzt um die VMs herunterzufahren und zu starten. Ich sehe aber nicht direkt den großen Nutzen davon, da Hyper-V selbst Optionen für das Beenden und Starten der VMs anbietet. Diese sind auch eingestellt. Sollte man dennoch VM Shutdown und VM Startup aktivieren?
  • Nach dem der Strom wieder da ist und die Server starten, habe ich auch gesehen, dass das Netzwerkprofil nicht richtig erkannt wurde, heißt anstatt Domänennetzwerk war Öffentliches Netzwerk eingestellt. Ich nehme an, die Ursache liegt daran, dass die Server schon an waren, bevor die Switche (Cisco SG300) komplett starten konnten. Meine Idee wäre, die Switche an Main Outlet Group anzuschließen und hierbei das Power Up Delay auf 0 zu setzen. Die Server wiederum an Outlet Group 1, und das Power Up Delay auf 60-120 Sekunden. Ist das korrekt?

Die Konfiguration ist zur Zeit folgende:

Ich gehe von einer Batteriedauer von 45 Minuten aus.
Auf den PCNS Clients habe ich eingestellt, dass bei einem "On Battery Event" ein Shutdown
  • für den physischen DC nach 1200 Sekunden / 20 Minuten,
  • für die Backup Server nach 900 Sekunden / 15 Minuten,
  • für die 2 Hyper-V Hosts nach 900 Sekunden / 15 Minuten + 180 Sekunden VM Shutdown Duration = 1080 Sekunden / 18 Minuten
initialisiert werden soll.

Somit wäre nach 20 Minuten + 70 Sekunden fester Wert + Shutdown Zeit für den Server alles herunter gefahren. Wenn innerhalb den ersten 15 / 20 Minuten Strom wieder da ist, passiert nichts.
Falls die Batterie der USV einen niedrigen Zustand erreicht hat, gibt es ja den Wert "Low Battery Duration", mit welchem man quasi den Shutdown für die Clients initialisiert. Das heißt, falls die USV eine restliche Laufzeit von x Minuten hat, dann beginnt ein Shutdown unabhängig von dem Wert, was der Client beim "On Battery Event" eingestellt hat. Ich hätte hierbei einen Wert zwischen 20-30 Minuten ausgewählt. Kann mir dazu jemand eine Empfehlung geben? Sind meine Überlegungen auf dem richtigen Weg? Wobei ich mit der Batteriedauer von 45 Minuten wohl nicht mehr ausgehen kann, da es ja nur noch 20-25 Minuten hält, aber mir ging es um die grundsätzliche Vorgehensweise.


Ansonsten, schöne Pfingstfeiertage noch!
Burak

Content-Key: 374617

Url: https://administrator.de/contentid/374617

Ausgedruckt am: 19.03.2024 um 04:03 Uhr

Mitglied: falscher-sperrstatus
falscher-sperrstatus 20.05.2018 aktualisiert um 20:22:21 Uhr
Goto Top
Hallo Burak,

nach 20min + 70 Sek ist viel zu spät.

Mal angenommen, es kommt wirklich zu einem langfristigen Ausfall, dann bringen dir die 20minuten nichts und normale Stromausfälle dauern vielleicht 2-3min, eher kürzer. Ich würde das Shutdown bei 5min starten und dann läuft das auch sauber, gerade weil der Shutdown einer unter voll unter Last stehenden Hyper-V Umgebung auch gerne mal bisschen länger dauert.
Ferner: 5 Hardwareserver und 400W? Sicher? Was sind das für Server?

Viele Grüße,

Christian
Mitglied: kaiand1
kaiand1 20.05.2018 um 21:22:18 Uhr
Goto Top
Die Laufzeit sind immer ca Werte und sollten nicht ausgereizt werden.
Die Last kannst du ja Verfolgen über den Tag was diese so Max/Durchschnitt ziehen um grob zu Rechnen.
Die USV gibt nicht immer Alarm wenn die Batterie Fehlerhaft ist da manche Fehler nur unter Last Auftreten und die meisten so nur im Standby laufen und viele auch diese nicht Kalibrieren.
Ein Zellendefekt kommt auch mal vor was ich letztens auch hatte da war ohne Last die Werte alle IO aber ab x % Last brach die Batterie ein und nix ging mehr und das ohne Vorankündigung....

Das Modell was du auch hast ist eher für den Kurzen Abfangen von Unterbrechungen wo nach 5 Minuten von einen Längerfristigen Problem ausgegangen werden muss.
Die Restliche Laufzeit kannst du nutzten um Switch/Internet Aufrecht zu erhalten für die VoIP Anlage das ggfs noch die Kommunikation möglich ist (Notruf ect) was viele auch nicht Bedenken seit der VoIP Umstellung besonders da die Aufzüge auch ein Nottelefon haben das per VoIP nach der Umstellung läuft...

Wenn du wirklich >20 Min überbrücken willst solltet ihr über andere Maßnahmen wie eine eigenes Notstromaggregat nachdenken um die Laufzeit zu Decken oder Größere USV mit mehr Akkus.
Mitglied: em-pie
em-pie 20.05.2018 um 22:42:18 Uhr
Goto Top
Moin,
Auch den denken:
Das ist hier eine LineInteractive-USV. Die benötigt ein paar Millisekunden zum Umschalten von Netz auf Akku-Betrieb. Wenn die Kondenstoren des NTs im Server das nicht abkönnen (weil billiges NT), bringt einem auch der noch so große Akku nichts (zumindest so die Theorie): Strom weg ist Strom weg...

In der Praxis ist mit das bisher allerdings -zugegeben- noch nie vorgekommen. Hatte aber bisher auch noch nie billige Server im Test-/ Ernstfall an der Netzlosen USV hängen...

Gruß
em-pie
Mitglied: vBurak
vBurak 21.05.2018 um 09:37:30 Uhr
Goto Top
Guten Morgen,

@certifiedit.net

Ich würde das Shutdown bei 5min starten und dann läuft das auch sauber, gerade weil der Shutdown einer unter voll unter Last stehenden Hyper-V Umgebung auch gerne mal bisschen länger dauert.

Ok, da die reale Laufzeit inzwischen ja eh deutlich geringer ist, muss ich das wohl so oder so machen.

Ferner: 5 Hardwareserver und 400W? Sicher? Was sind das für Server?
Laut der NMC Konsole sind es wie gesagt so 20-22% Last, das heißt von 2000 Watt entspricht das ja ca. 400 Watt.

Serverhardware sind
  • Xeon E3-1230 v2, 3x SAS Festplatten, Adaptec 6805E - Domain Controller
  • 2x Xeon E5-2600 v2, 8x 300GB SAS 15k, Adaptec 8805 - Hyper-V Host 2 VMs
  • 2x Intel Xeon E5607, 8x 500GB SATA, Adaptec 7805 - Hyper-V Host 5 VMs
  • Intel Xeon X3450, 4x4TB SATA - Backup
  • Intel Core i5 v2, 4 SATA HDD - Backup

Ein bisschen wundert mich auch, aber wenn die Konsole das nun mal wieder gibt. Sollte man die Server mal stressen und dann die Last anschauen?


@kaiand1

Die USV gibt nicht immer Alarm wenn die Batterie Fehlerhaft ist da manche Fehler nur unter Last Auftreten und die meisten so nur im Standby laufen und viele auch diese nicht Kalibrieren.

Eine Kalibrierung würde ich demnächst mal durchführen.

Das Modell was du auch hast ist eher für den Kurzen Abfangen von Unterbrechungen wo nach 5 Minuten von einen Längerfristigen Problem ausgegangen werden muss.

Gut, dann ziele ich eher ein korrektes Herunterfahren in kurzer Zeit an, als das die Laufzeit der Server möglichst hoch gehalten wird.

Die Restliche Laufzeit kannst du nutzten um Switch/Internet Aufrecht zu erhalten
Naja, Internet bringt ja auch nichts, wenn alle Computer dann kein Strom mehr haben ;) Telefon geht nicht über VoIP. Internet aufrecht zu erhalten, sollte ich noch hinzufügen, damit E-Mail Benachrichtigung durch kommen.

@em-pie

Das ist hier eine LineInteractive-USV. Die benötigt ein paar Millisekunden zum Umschalten von Netz auf Akku-Betrieb. Wenn die Kondenstoren des NTs im Server das nicht abkönnen (weil billiges NT), bringt einem auch der noch so große Akku nichts (zumindest so die Theorie): Strom weg ist Strom weg...

Billige Netzteile sollten das nicht sein. Das Problem, hatte ich bisher auch nicht gehabt. Aber trotzdem danke für die Info!
Mitglied: kaiand1
kaiand1 21.05.2018 um 10:42:56 Uhr
Goto Top
Wenn die USV Kalibriert ist sieht die Laufzeit anders aus da diese dann auf die Akkukapazität/Last Abgestimmt ist und so alle 3-5 Jahre die Akkus Tauscht wegen der Alterung und dem Leistungsschwund der Unterschiedlich ist.


Nun VoIP werdet ihr dann noch Bekommen...
Für Mitteilungen (SMS,Mail ect) könnte auch ein GSM Gateway für euch eine Option sein.
Da bei Stromausfall auch der Provider (Telefon,Internet) vor Ort Betroffen ist kann es sein das euer Telefon/Internet vorher schon weg ist bevor die USV den Shutdown Befehl gibt und dann keine Infomails mehr verschickt werden können.

Netzteile Altern auch und da kann es vorkommen sowie auch bei anderen Geräten Switche ect.
Wenn du den Umschaltmoment am PC/Server bist und zb Musik läuft hört man meist ein Knacken das vom Umschalten kommt.
Eine Altmodische Glühlampe an den Stromkreis und du siehst das Flackern (Dunkel werden) beim Umschalten auch.
Mitglied: monstermania
monstermania 22.05.2018 aktualisiert um 07:29:08 Uhr
Goto Top
Zitat von @vBurak:
(Nur) 2 Server haben ein redundantes Netzteil, welche zusätzlich direkt an der Steckdose angeschlossen sind.
Die Last beträgt ungefähr 20-22%, das entspricht ca. 400 Watt.

Moin,
abgesehen von den anderen Beiträgen mußt Du bedenken, dass in dieser Konstellation die Leistungsaufnahme der Server mit Dual-NT nicht bestimmt werden kann. I.D.R. läuft bei einem Server mit Dual NT nur ein Netzteil. Das andere NT befindet sich im Standby. Wenn dann das Standby-NT an der USV hängt wird im Falle eines Stromausfalls die reale Last auf der USV dann plötzlich ungleich höher sein! Einfach mal unter realen Bedingungen testen und den Hauptschalter ausschalten (natürlich am Wochenende!).
Wir haben hier 2 parallele APC (2200 u. 3000) an die alle Kernkomponenten über Kreuz angeschlossen sind. Reale Laufzeit im Falle eines Stromausfalls ca. 25 Minuten. Unser geordneter Notfallshutdown (~30 VM) braucht max. 17 Minuten. Und immer dran denken, dass eine VM auch mal beim herunterfahren hängen bleiben kann.

Gruß
Dirk
Mitglied: kaiand1
kaiand1 22.05.2018 um 10:15:57 Uhr
Goto Top
Zitat von @monstermania:

Zitat von @vBurak:
(Nur) 2 Server haben ein redundantes Netzteil, welche zusätzlich direkt an der Steckdose angeschlossen sind.
Die Last beträgt ungefähr 20-22%, das entspricht ca. 400 Watt.

Moin,
abgesehen von den anderen Beiträgen mußt Du bedenken, dass in dieser Konstellation die Leistungsaufnahme der Server mit Dual-NT nicht bestimmt werden kann. I.D.R. läuft bei einem Server mit Dual NT nur ein Netzteil. Das andere NT befindet sich im Standby. Wenn dann das Standby-NT an der USV hängt wird im Falle eines Stromausfalls die reale Last auf der USV dann plötzlich ungleich höher sein! Einfach mal unter realen Bedingungen testen und den Hauptschalter ausschalten (natürlich am Wochenende!).
Wir haben hier 2 parallele APC (2200 u. 3000) an die alle Kernkomponenten über Kreuz angeschlossen sind. Reale Laufzeit im Falle eines Stromausfalls ca. 25 Minuten. Unser geordneter Notfallshutdown (~30 VM) braucht max. 17 Minuten. Und immer dran denken, dass eine VM auch mal beim herunterfahren hängen bleiben kann.

Gruß
Dirk

Gibt aber auch Netzteile die ihre Last Aufteilen auf alle Verfügbare und wenn eins Ausfällt (Defekt,Stromausfall) übernehmen die andere die Last wodurch an deren Steckplatz die Stromaufnahme steigt.
Mitglied: monstermania
monstermania 22.05.2018 um 12:09:38 Uhr
Goto Top
Zitat von @kaiand1:
Gibt aber auch Netzteile die ihre Last Aufteilen auf alle Verfügbare und wenn eins Ausfällt (Defekt,Stromausfall) übernehmen die andere die Last wodurch an deren Steckplatz die Stromaufnahme steigt.
Hast natürlich recht!
Ändert aber am grundsätzlichen Problem des Fragestellers auch nichts. Mit Netzstrom an der Servern wird Ihm nicht die tatsächliche Last auf der USV angezeigt. Reale Werte/Laufzeiten gibt es daher nur bei einem externen 'Strom' aus.