47530
Goto Top

Nagios Eskalationsmanagement

Nagios Eskalationsmanagement bei Netzproblemen

Hallo zusammen,

ich bräuchte mal eure Hilfe. Ich finde im Nagios Handbuch bzw bei Google nicht zu diesem Thema, evtl. suche ich auch nach den falschen Begriffen (sagt dann bitte kurz bescheid)!

Mein Problem:

Wir haben im Moment hier ziemlich viele Netzprobleme (das Netzwerk wir nicht von uns selbst verwaltet, sondern nur die Server). Nagios registriert das natürlich und schick eine e-Mail das der betreffende Server nicht mehr erreichbar ist. Das wäre nicht das Problem, allerding hängen an diesen Netzwerkkomponenten >30 Server die alle über das Nagios überwacht werden. Dadurch bekomme ich (und andere Kollegen der gleichen Eskalationsstufe) 40-60 e-Mails das unsere Server ausgefallen sind (Der Ausfall dauert meist 1-5 Minuten, kommt unregelmässig und wird wohl nicht so schnell behoben werden. Die komplette Konfiguration so um zu stellen das er erst ab 5 Minuten warnt ist keine Option).

Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)

Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?


THX
MFG

Takeoo

Content-Key: 148705

Url: https://administrator.de/contentid/148705

Printed on: April 23, 2024 at 21:04 o'clock

Member: Wolfsrudel
Wolfsrudel Aug 10, 2010 at 11:39:58 (UTC)
Goto Top
Mitglied: 47530
47530 Aug 10, 2010 at 13:15:07 (UTC)
Goto Top
Das ist ja ganz nett nur wird es Nagios nicht davon abhalten mir weiterhin für alles andere eine Mail zu schicken!(?)
Mir wäre lieber wenn jemand eine "offzielle" Lösung für dieses Problem hätte (evtl. ein Befehl der schon mit Nagios selbst mit kommt. Bzw. eine Filterregel)
Member: CadelPigott
CadelPigott Aug 10, 2010 at 14:19:30 (UTC)
Goto Top
Hallo Takeoo,

soweit ich weis ist das mit Nagios Boardmitteln nicht möglich.

Die Onlinedoku gibt hierzu folgenden Tip: http://nagios.sourceforge.net/docs/2_0/escalations.html (ganz unten)

Gruß
Cadel
Member: chrismass
chrismass Aug 12, 2010 at 09:40:30 (UTC)
Goto Top
Zitat von @47530:

Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer
Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur
eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)

Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?


THX
MFG

Takeoo

Hallo!
Ich bin ganz neu im Thema Monitoring und lese mich gerade erst ein. Im Buch "Nagios - System und Netzwerkmonitoring" von Wolfgang Barth wird aber bereits in den ersten Kapiteln genau dieser Anwendungsfall beschrieben. Er schreibt davon, dass man Abhängigkeiten und die Netztopologie berücksichtigen soll.
Also in deinem Fall:
Du hast eine Anzahl x an Services die auf den Servern überwacht werden. Die Server hängen jedoch alle hinter einem oder mehreren Netzkomponenten wie Router und / oder Switches. Wenn du nun diese Netzkomponenten überwachst, kann man eine Abhängigkeit bilden. Also wenn Netzkomponente A ausfällt, soll Nagios keine Fehler mehr bezüglich der dahinterliegenden Services melden (weidl die ja dann eh nicht geprüft werden können).
Also so viel mal zur Theorie face-smile Hoffe das hilft dir etwas weiter.
Wie es in der Praxis funktioniert? ... So weit bin ich noch nicht mit lesen face-big-smile

Grüße
chrismass
Mitglied: 47530
47530 Sep 07, 2010 at 08:24:48 (UTC)
Goto Top
Hi Chrismass,
hab mir jetzt auch mal das Buch angeschafft!
THX
lg Takeoo
Member: JackONeil
JackONeil Sep 22, 2010 at 17:00:53 (UTC)
Goto Top
HI Takeoo,

Ich nutzte bei uns in der Firma seit knapp 1,5 Jahren NAgios . Habe letztens ein 2 . System aufgesetzt was 80 Server mit jeweils 15 services monitort. Falls du deine Server an einem Standort oder mehreren hast, und die PLattformen (OS etc) gleich ist, würde ich dir das Addon check_mk empfehlen. EIn agent auf jeden Rechner...einen befehl und du hast alle auto. inventarisiert.
Jedenfalls zu den eskalationsmanagement hier ein sehr hilfreicher Link aus der offiziellen Doku. Ich nutzte es zur zeit.
http://nagios.sourceforge.net/docs/3_0/objecttricks.html#serviceescalat ...

ein paar tips vor weg: wenn du SMS und email nutzt würde ich für jeden User einen extra SMS user anlegen und diese beispiels weise in eine extra"sms contactgroup" packen. Dann kannst mit den servicesscalation prima loslegen.

Ich habe zur Zeit 3 Eskalationen geplant: 1. 24 stunden alle Services von allen Hostgroups an admins , 2. nach der 4. Untätigkeit der admins sollen bis zu 4 weitere nachrichten an eine 2. Gruppe gehen. 3. wenn sich diese auch nicht meldet dann werden max. 2 sms an eine 3. gruppe geschickt. Wenn du willst kann ich dir eine Beispielkonfig schicken.