check_ganglia_metric

Skjermbilde programvare:
check_ganglia_metric
Prog.varedetaljer:
Versjon: 2012.02.28
Last opp dato: 15 Apr 15
Lisens: Gratis
Popularitet: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric er en Nagios plugin som gjør det mulig å utløse varsler på noen ganglia beregning.
check_ganglia_metric var sterkt inspirert av Vladimir Vuksan sin check_ganglia_metric.php, men det kommer med en rekke forbedringer.

Installasjon

# PIP installere check_ganglia_metric
... Eller:
# Easy_install check_ganglia_metric
ganglia Konfigurasjon
Med mindre din Nagios server og ganglia Meta Daemon kjører på samme vert, Du trenger sannsynligvis å redigere ditt gmetad.conf å tillate eksterne tilkoblinger fra Nagios server.
Å tillate tilkoblinger fra nagios-server.example.com:
trusted_hosts nagios-server.example.com
Å tillate tilkoblinger fra alle verter (sannsynligvis en sikkerhetsrisiko):
all_trusted på
Testing på Command Line
Først, la oss se om check_ganglia_metric kan kommunisere med ganglia Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Status Ok, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
"Status Ok" meldingen viser at check_ganglia_metric fungerer. Hvis du har problemer med å få dette til å fungere, prøv igjen med detaljert logging aktivert (verbose) for å få bedre innsikt i hva som går galt.
La oss nå prøve å sette et varsel terskel:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Status Kritisk, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Vi fortalte check_ganglia_metric å returnere en "kritisk" status hvis Idle CPU var større enn 99. "Status Kritisk" meldingen viser at det fungerte. Merk at check_ganglia_metric analyserer serier og terskler i henhold til de offisielle Nagios retningslinjer plugin utvikling.
For å se en fullstendig liste over kommandolinjealternativer med korte forklaringer, kjøre check_ganglia_metric med hjelp alternativet.
Nagios konfigurasjon
Først oppretter en kommando definisjon:
definere kommando {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
Nå kan du bruke kommandoen over i service definisjoner:
definere tjenesten {
& Nbsp; service_description CPU idle - ganglia
& Nbsp; bruk some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
Dette vil fungere fint før noe går galt med check_ganglia_metric (f.eks cache-filen ikke kan leses / skrives til, ganglia Meta Daemon kan ikke nås, etc.). På dette punktet, vil alle tjenester som er avhengig av check_ganglia_metric mislykkes, muligens oversvømt deg med varsler. Vi kan hindre dette ved bruk av serviceavhengigheter.
Det første vi trenger er en kommando definisjon for å sjekke alderen til en fil:
definere kommando {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / Nagios / plugins / check_file_age -f $ ARG1 $ w $ ARG2 $ c $ ARG3 $
}
Deretter definerer vi en tjeneste som sjekker alderen på check_ganglia_metric buffer fil. Legg merke til at for å være virkelig effektiv, må denne tjenesten være sjekket minst like (helst mer) oftere enn alle de andre kontroller som er avhengige av check_ganglia_metric:
definere tjenesten {
& Nbsp; service_description Cache for check_ganglia_metric
& Nbsp; bruk some_template
& Nbsp;!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; host_name localhost
& Nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
Og til slutt, setter vi opp selve tjenesten avhengighet. Legg merke til at jeg har aktivert use_regexp_matching i Nagios, som tillater meg å bruke vanlige uttrykk i mine direktiver. Ved å stikke "- ganglia" på slutten av hver tjeneste som er avhengig av check_ganglia_metric, kan jeg spare meg selv mye arbeid:
definere servicedependency {
& Nbsp; host_name localhost
& Nbsp; service_description Cache for check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - ganglia $
& Nbsp; execution_failure_criteria c, p
}
Nå hvis noe går galt med check_ganglia_metric, vil bare ett varsel bli sendt ut om cache-filen, og alle avhengige servicekontrollene vil bli stanset inntil du fikse problemet som forårsaket check_ganglia_metric å mislykkes. Når problemet er løst, må du oppdatere tidsstempel på cache-filen for å sette "Cache for check_ganglia_metric" service tilbake til en OK tilstand (som vil tillate avhengige servicekontrollene for å fortsette):
& Nbsp; berørings /var/lib/nagios/.check_ganglia_metric.cache
Tips og triks
Det er mulig å få en komplett liste over tilgjengelige verter og beregninger ved at "mer detaljert" logging (-vv). Siden metric_host og METRIC_NAME alternativer er nødvendig, har du en liten bit av en "høna og egget" problem her, men det er OK. Bare levere noen dummy data. Programtillegget vil feil ut på slutten med en "host / metriske ikke funnet" feil, men ikke før det dumper sin cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = dummy --metric_name = dummy -vv

Hva er nytt i denne utgaven:

  • Legg til - -metrics_max_age alternativ
  • Merge CHANGELOG.rst inn README.rst

Krav :

  • Python
  • Nagios

Begrensninger :

  • Fungerer ikke med Python 2.4

Lignende programvare

Sample
Sample

3 Jun 15

cloudwatch-robot
cloudwatch-robot

20 Feb 15

cp2fwbuilder
cp2fwbuilder

3 Jun 15

LibTomCrypt
LibTomCrypt

2 Jun 15

Kommentarer til check_ganglia_metric

Kommentarer ikke funnet
Legg til kommentar
Slå på bilder!