check_ganglia_metric

Software screenshot:
check_ganglia_metric
Software detaljer:
Version: 2012.02.28
Upload dato: 15 Apr 15
Licens: Gratis
Popularitet: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric er en Nagios plugin, der gør det muligt at udløse alarmer på enhver Ganglier metrisk.
check_ganglia_metric var stærkt inspireret af Vladimir Vuksan s check_ganglia_metric.php, men det kommer med en række forbedringer.

Installation

# PIP, installere check_ganglia_metric
... Eller:
# Easy_install check_ganglia_metric
Ganglier konfiguration
Medmindre din Nagios server og Ganglier Meta Daemon kører på den samme vært, har du sandsynligvis brug for at redigere din gmetad.conf at tillade fjernforbindelser fra din Nagios server.
Hvis du vil tillade forbindelser fra nagios-server.example.com:
trusted_hosts nagios-server.example.com
For at tillade forbindelser fra alle værter (sandsynligvis en sikkerhedsrisiko):
all_trusted på
Test på kommandolinjen
Først, lad os se om check_ganglia_metric kan kommunikere med ganglierne Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Status Ok, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
"Status Ok" meddelelse angiver, at check_ganglia_metric virker. Hvis du har problemer med at få dette til at arbejde, så prøv igen med detaljeret logføring aktiveret (--verbose) for at få bedre indblik i, hvad der går galt.
Lad os forsøge at indstille en alarm tærskel:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Status Kritisk, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Vi fortalte check_ganglia_metric at returnere en "kritisk" status, hvis den Idle CPU var større end 99. "Status kritiske" meddelelse angiver, at det virkede. Bemærk at check_ganglia_metric parser intervaller og tærskler i henhold til de officielle Nagios retningslinjer plugin for udvikling.
Du kan se en komplet liste over kommandolinjetilvalg med korte forklaringer, køre check_ganglia_metric med --help mulighed.
Nagios konfiguration
Først skal du oprette en kommando definition:
definere kommandoen {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ Arg3 $
}
Nu kan du bruge ovenstående kommando i din tjeneste definitioner:
definere tjeneste {
& Nbsp; service_description CPU tomgang - Ganglier
& Nbsp; brug some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; HOST_NAME host.example.com
}
Dette vil fungere fint indtil noget går galt med check_ganglia_metric (f.eks cache-filen kan ikke læses / skrives til, ganglier Meta Daemon kan ikke nås, etc.). På det tidspunkt vil hver service, der bygger på check_ganglia_metric mislykkes, eventuelt oversvømmede dig med advarsler. Vi kan forhindre dette ved hjælp af service-afhængigheder.
Den første ting, vi har brug for er en kommando definition til kontrol alder en fil:
definere kommandoen {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / Nagios / plugins / check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ Arg3 $
}
Dernæst definerer vi en service, der kontrollerer en alder af check_ganglia_metric cache fil. Bemærk, at for at være virkelig effektiv, brug denne service skal kontrolleres mindst lige så (helst flere) hyppigere end alle de andre kontroller, der er afhængige af check_ganglia_metric:
definere tjeneste {
& Nbsp; service_description Cache for check_ganglia_metric
& Nbsp; brug some_template
& Nbsp;!!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; HOST_NAME localhost
& Nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
Og endelig har vi oprettet den faktiske tjeneste afhængighed. Bemærk, at jeg har aktiveret use_regexp_matching i Nagios, som tillader mig at bruge regulære udtryk i mine direktiver. Ved at holde "- Ganglier" i slutningen af ​​hver tjeneste, der bygger på check_ganglia_metric kan jeg spare mig selv en stor indsats:
definere servicedependency {
& Nbsp; HOST_NAME localhost
& Nbsp; service_description Cache for check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglier $
& Nbsp; execution_failure_criteria c, p
}
Nu, hvis noget går galt med check_ganglia_metric, vil kun én indberetning sendes ud af om cache-fil, og alle afhængige serviceeftersyn vil blive sat på pause, indtil du løse det problem, der forårsagede check_ganglia_metric at mislykkes. Når problemet er løst, skal du opdatere tidsstemplet på cache-fil for at sætte "Cache for check_ganglia_metric" service tilbage i en OK tilstand (som vil give afhængige serviceeftersyn for at fortsætte):
& Nbsp; røre /var/lib/nagios/.check_ganglia_metric.cache
Tips og tricks
Det er muligt at få en komplet liste over tilgængelige computere og målinger ved at muliggøre "mere detaljeret" logning (-vv). Da der er behov for metric_host og METRIC_NAME muligheder, du har en lille smule af en "hønen og ægget" problem her, men det er OK. Bare give nogle tomme data. Dette plugin vil fejl i slutningen med en "host / metrisk ikke fundet" fejl, men ikke før den dumper sin cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = dummy --metric_name = dummy -vv

Hvad er nyt i denne udgivelse:

  • Tilføj - -metrics_max_age option
  • Flet CHANGELOG.rst i README.rst

Krav :

  • Python
  • Nagios

Begrænsninger :

  • virker ikke med Python 2.4

Lignende software

NxFilter
NxFilter

7 Mar 16

ebtables
ebtables

15 Apr 15

FW1-Loggrabber
FW1-Loggrabber

3 Jun 15

battery_monitor
battery_monitor

2 Jun 15

Kommentarer til check_ganglia_metric

Kommentarer ikke fundet
Tilføj kommentar
Tænd billeder!