Pour cela, il nous suffit de créer le fichier contenant le script de la sonde:
vi /usr/lib/nagios/plugins/check_test
Et de mettre cela dedans:
Pour cela, il nous suffit de créer le fichier contenant le script de la sonde:
vi /usr/lib/nagios/plugins/check_test
Et de mettre cela dedans:
Nous allons voir comment permettre à un serveur Centreon de surveiller des ESXi avec le script check_vmware_api.pl.
yum install -y openssl-devel perl-Archive-Zip perl-Class-MethodMaker uuid-perl perl-SOAP-Lite perl-XML-SAX perl-XML-NamespaceSupport perl-XML-LibXML perl-MIME-Lite perl-MIME-Types perl-MailTools perl-TimeDate uuid libuuid perl-Data-Dump perl-UUID cpan libxml2-devel perl-libwww-perl perl-Test-MockObject perl-Test-Simple perl-Monitoring-Plugin perl-Class-Accessor perl-Config-Tiny gcc python perl-Nagios-Plugin
L’installation du « VMware vSphere Perl SDK » est indispensable.
Vous pourrez le télécharger après vous êtes créé un compte VMware.
vSphere SDK for Perl 5.5U2
https://my.vmware.com/web/vmware/details?downloadGroup=SDKPERL552&productId=353
vSphere SDK for Perl 6.0U2
https://my.vmware.com/web/vmware/details?downloadGroup=PERLSDK60U2&productId=610
vSphere Perl SDK 6.5
https://my.vmware.com/web/vmware/details?downloadGroup=VS-PERL-SDK65&productId=614
Une fois téléchargé, on décompresse l’archive et on installe le SDK:
tar xvf VMware-vSphere-Perl-SDK-6.5.0-4566394.x86_64.tar.gz
cd vmware-vsphere-cli-distrib/
perl vmware-install.pl
Perl aura besoin de plusieurs module pour pouvoir exécuter le script check_vmware_api.pl.
Si vous êtes derrière un proxy, il faudra le déclarer avant d’installer les modules:
perl -MCPAN -e shell
o conf init /proxy/
Your ftp_proxy? http://IP:PORT/
Your http_proxy? http://IP:PORT/
Your no_proxy? http://IP:PORT/
Your proxy user id?
o conf commit
On peut maintenant installer nos modules:
perl -MCPAN -e 'install Params::Validate'
perl -MCPAN -e 'install Nagios::Plugin'
perl -MCPAN -e 'install Monitor::Plugin'
perl -MCPAN -e 'install Monitoring::Plugin'
perl -MCPAN -e 'install Math::Calc::Units'
perl -MCPAN -e 'install Config::Tiny'
https://github.com/op5/check_vmware_api
cd /tmp
wget https://github.com/op5/check_vmware_api/archive/master.zip
unzip master.zip
cd check_vmware_api-master/
mv check_vmware_api.pl /usr/lib/nagios/plugins/
/usr/lib/nagios/plugins/check_vmware_api.pl
Usage: check_vmware_api.pl -D <data_center> | -H <host_name> [ -C <cluster_name> ] [ -N <vm_name> ]
-u <user> -p <pass> | -f <authfile>
-l <command> [ -s <subcommand> ] [ -T <timeshift> ] [ -i <interval> ]
[ -x <black_list> ] [ -o <additional_options> ]
[ -t <timeout> ] [ -w <warn_range> ] [ -c <crit_range> ]
[ -V ] [ -h ]
Missing argument: command
Le script fonctionne, nous pouvons donc essayer d’interroger notre ESXi:
/usr/local/nagios/libexec/check_vmware_api.pl -H 192.168.122.64 -u utilisateur -p mot_de_passe -l cpu -s usage
check_esx_vmfs
$USER1$/check_vmware_api.pl -D $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l vmfs -o used -s $_SERVICEDATASTORENAME$ -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie le niveau d’utilisation du datastore
check_esx_cpu
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l cpu -s usage -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie la charge CPU de l’ESXi – Argument : niveau WARNING et CRITICAL (en %)
check_esx_health
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l runtime -s health
Vérifie la santé du serveur ESXi
check_esx_issues
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l runtime -s issues
Vérifie les problèmes du serveur ESXi
check_esx_status
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l runtime -s status
Vérifie l’état du serveur ESXi
check_esx_mem
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l mem -s usage -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie la charge mémoire de l’ESXi
check_esx_swap
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l mem -s swap -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie la charge mémoire de l’ESXi
check_esx_io_read
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l io -s read -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie les entrées/sorties en lecture de l’ESXi
check_esx_io_write
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l io -s write -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie les entrées/sorties en écriture de l’ESXi
check_esx_net
$USER1$/check_vmware_api.pl -H $HOSTADDRESS$ -u $_HOSTUSERESX$ -p $_HOSTUSERPASSWORD$ -l net -s usage -w $_SERVICEWARNING$ -c $_SERVICECRITICAL$
Vérifie la charge réseaux de l’ESXi – Argument : niveau WARNING et CRITICAL (en Kbps)
Pour utiliser la commande check_nrpe du serveur Centreon sur un poste Windows, nous devons installer NSCLIENT++ avec la configuration op5.
On lance l’installation sur l’hôte Windows à monitorer
On va donc choisir « op5 » à la place de « Generic », puis on clique sur « Next »
On choisit « Complete » puis on clique sur « Next »
On clique sur « Next »
On autorise l’adresse ip du serveur Centreon, puis on clique sur « Next »
On clique sur « Install »
On clique sur « FInish »
Une fois terminée, la commande check_nrpe du serveur Centreon marchera sur le client Windows.
On peut le vérifier avec cette commande:
/usr/local/nagios/libexec/check_nrpe -H 192.168.122.174
I (0.5.0.62 2016-09-14) seem to be doing fine...
Il faudra toutefois adapter la commande qui sera lancée par check_nrpe pour qu’elle soit « Windows friendly« .
/usr/local/nagios/libexec/check_nrpe -H 192.198.122.174 -c Check_OS_Version -a 'perf-config=*(ignored:true)'
OK: Windows Server 2016 Technical Preview (10.0.14393)
Vérifier où sont situé vos scripts dans nrpe.cfg ( /usr/lib/… ou /usr/lib64/…).
Vérifier l’espace disque de /data:
/usr/lib64/nagios/plugins/check_disk -w 10% -c 5% -p /data
Vérifier l’état d’un volume Raid:
/usr/lib/nagios/plugins/check_raid.pl -p mdstat
Vérifier la date de modification du fichier /ftp/texte.txt :
/usr/lib64/nagios/plugins/check_file_age -w 86400 -c 129600 -f /ftp/texte.txt
1 heure = 3600 secondes
24 heures = 86400 secondes
36 heures = 129600 secondes
7 jours = 604800 secondes
30 jours = 2592000 secondes
6 mois = 15379200 secondes
Vérification de processus:
/usr/lib64/nagios/plugins/check_procs -w 80 -c 95 -m CPU -C httpd
/usr/lib64/nagios/plugins/check_procs -w 1:512 -c 1:1024 -C smbd
/usr/lib64/nagios/plugins/check_procs -c 1:1 -C nmbd
-w 1:512 correspond à Warning si le nombre de processus n’est pas entre 1 et 512.
-c 1:1024 correspond à Critical si le nombre de processus n’est pas entre 512 et 1024.
-c 1:1 correspond à Critical sil n’y a pas 1 processus (au min et au max).
Surveillance de la Swap:
/usr/lib64/nagios/plugins/check_swap -w 80% -c 40%
APT:
/usr/lib64/nagios/plugins/check_apt
-u = fait un apt-get update avant le lancer le script (lancé par l’utilisateur nagios).
-t 120 = timout de 120 sec (le temps de faire un apt-get update).
Mysql:
/usr/lib64/nagios/plugins/check_mysql -uworkey -pworkey
File d’attente des courriels:
/usr/lib64/nagios/plugins/check_mailq -w 40 -c 50
Charge CPU
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c CheckCPU -a warn=80 crit=90 time=1m time=5m time=15m
% CPU utilisé
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:% Processor Used Total=\Processor(_Total)\% Processor Time' 'warning=value>80' 'critical=value>90' 'perf-config=*(suffix:none)'
% CPU Libre
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:% Processor Free Total=\Processor(_Total)\% Idle Time' 'warning=value<20' 'critical=value<10' 'perf-config=*(suffix:none)'
RAM utilisée en Mo
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c Check_Memory -a show-all type=physical 'warning=used>1536M' 'critical=used>1792M'
RAM utilisée en %
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c Check_Memory -a show-all type=physical 'warning=used>80%' 'critical=used>90%'
RAM libre en Mo
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c Check_Memory -a show-all type=physical 'warning=free<512M' 'critical=free<256M'
RAM libre en %
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c Check_Memory -a show-all type=physical 'warning=free<20%' 'critical=free<10%'
Performance disque Lecture en % de C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: % Read Time=\LogicalDisk(C:)\% Disk Read Time' 'warning=value>50' 'critical=value>75' 'perf-config=*(suffix:none)'
Performance disque Lecture en Bits/Sec de C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: Read Bytes/sec=\LogicalDisk(C:)\Disk Read Bytes/sec' 'warning=value>100' 'critical=value>500' 'perf-config=*(suffix:none)'
Performance disque écriture en % de C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: % Write Time=\LogicalDisk(C:)\% Disk Write Time' 'warning=value>50' 'critical=value>75' 'perf-config=*(suffix:none)'
Performance disque écriture en Bits/Sec de C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: Write Bytes/sec=\LogicalDisk(C:)\Disk Write Bytes/sec' 'warning=value>100' 'critical=value>500' 'perf-config=*(suffix:none)'
File d’attente IO sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: Queue Length=\LogicalDisk(C:)\Current Disk Queue Length' 'warning=value>10' 'critical=value>20' 'perf-config=*(suffix:none)'
Nombre d’IO par Seconde sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:C: Split IO/sec=\LogicalDisk(C:)\Split IO/sec' 'warning=value>10' 'critical=value>20' 'perf-config=*(suffix:none)'
Espace libre en Go sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a drive=C: 'warning=free<10G' 'critical=free<5G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free} free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en % sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a drive=C: 'warning=free<20%' 'critical=free<10%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free_pct}% free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en Go sur tous les disques
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a 'warning=free<10G' 'critical=free<5G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free} free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en % sur tous les disques
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a 'warning=free<20%' 'critical=free<10%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free_pct}% free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en Go sur tous les disques sauf disquette et CDROM
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a "filter=type in ('fixed')" exclude='System Reserved' 'warning=free<10G' 'critical=free<5G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free} free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en % sur tous les disques sauf disquette et CDROM
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a "filter=type in ('fixed')" exclude='System Reserved' 'warning=free<20%' 'critical=free<10%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free_pct}% free / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace libre en Go sur tous les disques sauf E:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a exclude='E:\' 'warning=free<10G' 'critical=free<5G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free} free / ${size} total}' top-syntax='${status}: ${problem_list}'
(pour deux disques: exclude=’E:\’ exclude=’P:\’)
Espace libre en Go sur tous les disques sauf disquette, CDROM et E:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a "filter=type in ('fixed')" exclude='System Reserved' exclude='E:\' 'warning=free<10G' 'critical=free<5G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free} free / ${size} total}' top-syntax='${status}: ${problem_list}'
(pour deux disque=> exclude=’E:\’ exclude=’P:\’)
Espace libre en % sur tous les disques sauf E:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a exclude='E:\' 'warning=free<20%' 'critical=free<10%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free_pct}% free / ${size} total}' top-syntax='${status}: ${problem_list}'
(pour deux disque=> exclude=’E:\’ exclude=’P:\’)
Espace libre en % sur tous les disques sauf disquette, CDROM et E:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a exclude='E:\' "filter=type in ('fixed')" exclude='System Reserved' 'warning=free<20%' 'critical=free<10%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${free_pct}% free / ${size} total}' top-syntax='${status}: ${problem_list}'
(pour deux disque=> exclude=’E:\’ exclude=’P:\’)
Espace utilisé en Go sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a drive=C: 'warning=used>50G' 'critical=used>100G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used} used / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace utilisé en % sur C:\
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a drive=C: 'warning=used>80%' 'critical=used>90%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used_pct}% used / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace utilisé en Go sur tous les disques
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a 'warning=used>50G' 'critical=used>100G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used} used / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace utilisé en Go sur tous les disques sauf disquette et cdrom
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a "filter=type in ('fixed')" exclude='System Reserved' 'warning=used>50G' 'critical=used>100G' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used} used / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace utilisé en % sur tous les disques
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a 'warning=used>80%' 'critical=used>90%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used_pct}% used / ${size} total}' top-syntax='${status}: ${problem_list}'
Espace utilisé en % sur tous les disques sauf disquette et cdrom
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_drivesize -a "filter=type in ('fixed')" exclude='System Reserved' 'warning=used>80%' 'critical=used>90%' show-all 'perf-config=*(unit:G)' detail-syntax='{${drive_or_name} ${used_pct}% used / ${size} total}' top-syntax='${status}: ${problem_list}'
Nombre de fichier dans C:\Repertoire
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_files -a path='C:\\Repertoire' pattern=*.* 'warning=count>500' 'critical=count>1000' top-syntax='${status}: ${problem_count}/${count} files' 'empty-state=ok'
Vérifie si au moins un fichier à une taille supérieure à 500Mo dans C:\, critique si oui
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_files -a path='C:\\' pattern=*.* 'filter=size gt 500M' 'critical=count>0' 'detail-syntax=%(filename): %(size)' 'empty-state=ok'
Vérifie la présence du fichier C:\test (il ne doit pas être vide)
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_files -a path='C:\\' pattern='test*' max-depth=1 'critical=count<1' 'empty-state=critical'
Vérifier la présence du répertoire C:\Users
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_files -a file="c:\\" "max-depth=2" "filter=filename='Users'" "critical=count<1" "empty-state=CRITICAL" "empty-syntax=CRITICAL - Cannot find folder Users"
Vérifie que les fichiers dans C:\Repertoire ont été modifié depuis moins de deux heures
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_files -a path='C:\\Repertoire' pattern=*.* 'filter=written > -2h' 'critical=count<1' 'empty-state=critical'
Vérifie que les fichiers dans C:\Repertoire ont été modifié depuis plus de deux heures
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_files -a path='C:\\Repertoire' pattern=*.* 'filter=written < -2h' 'critical=count>0' top-syntax='${status}: ${problem_count}/${count} files' 'empty-state=ok'
Particularité « path= » et « pattern= »:
Si vous vouliez seulement spécifier un fichier:
path='C:\\test.txt'
Mais si il est possible que le fichier n’existe pas, on utilisera alors « pattern= ».
path='C:\\' pattern='test.txt'
Surveillance de la carte réseau en Bits reçu par sec
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Bytes Received/sec=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Bytes Received/Sec' 'warning=value>786432000' 'critical=value>943718400' 'perf-config=*(suffix:none)'
Surveillance de la carte réseau en Bits envoyé par sec
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Bytes Sent/sec=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Bytes Sent/Sec' 'warning=value>786432000' 'critical=value>943718400' 'perf-config=*(suffix:none)'
Nombre de paquet envoyé en erreur par la carte réseau
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Packets Outbound Errors=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Packets Outbound Errors' 'warning=value>0' 'critical=value>0' 'perf-config=*(suffix:none)'
Nombre de paquet reçu en erreur par la carte réseau
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Packets Received Errors=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Packets Received Errors' 'warning=value>0' 'critical=value>0' 'perf-config=*(suffix:none)'
Nombre de paquet envoyé en erreur par la carte réseau et jeté (discarded)
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Packets Outbound Discarded=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Packets Outbound Discarded' 'warning=value>0' 'critical=value>0' 'perf-config=*(suffix:none)'
Nombre de paquet reçu en erreur par la carte réseau et jeté (discarded)
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c check_pdh -a 'counter:Packets Received Discarded=\Network Interface(Intel[R] PRO_1000 MT Network Connection)\Packets Received Discarded' 'warning=value>0' 'critical=value>0' 'perf-config=*(suffix:none)'
Version Windows de l’OS
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c Check_OS_Version -a 'perf-config=*(ignored:true)'
File d’attente de l’imprimante « Microsoft XPS Document Writer »
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -c CheckCounter -a 'Counter:XPS Document Writer=\Print Queue(Microsoft XPS Document Writer)\Jobs' MaxWarn=5 MaxCrit=15 ShowAll
Uptime, critique si plus d’un jour
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c Check_Uptime -a show-all 'warning=uptime>1d' 'critical=uptime>1d'
Uptime, critique si moins d’un jour
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c CheckUpTime -a MinCrit=1d
Surveillance de l’activité du service Spooler, critique si il n’est pas démarré
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_service -a 'service=spooler'
Surveillance de l’arrêt du service Spooler, critique si il est démarré
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_service -a 'service=spooler' "ok= state = 'stopped'" "warning=not state = 'stopped'" "critical=not state = 'stopped'" "perf-config=*(ignored:true)"
Vérifie si tous les services activés au demarrage sont bien démarré
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_service
Vérifie si les services activé au demarrage sont bien démarré, sauf le service spooler
/usr/local/nagios/libexec/check_nrpe -H 10.148.14.212 -t 30 -c check_service -a exclude=Spooler
On commence par installer le script check_nrpe:
yum install -y nrpe-plugin
Par défaut, la variable $USER1$ qui correspond au répertoire où sont stockés les scripts Centreon, pointe sur /usr/lib/nagios/plugins/
, alors que check_nrpe a été installé dans /usr/lib64/nagios/plugins/
. Nous devons donc créer un lien symbolique pour que check_nrpe y soit présent.
ln -s /usr/lib64/nagios/plugins/check_nrpe /usr/lib/nagios/plugins/check_nrpe
Sur l’interface web de Centreon, nous allons maintenant configurer la commande check_nrpe.
Pour cela nous allons dans Configuration / Commandes puis on clique sur ajouter:
Dans ligne de commande on met ceci:
$USER1$/check_nrpe -H $HOSTADDRESS$ -p $_SERVICEPORT$ $_SERVICECOMMAND$
Puis on clique sur « Décrire les macro » puis sauvegarder sur le pop-up qui apparaît, pour générer le texte suivant:
MACRO (SERVICE) PORT :
MACRO (SERVICE) COMMAND :
Nous pouvons maintenant créer des services NRPE. Pour cela nous allons dans Configuration / Services / Modèles puis on clique sur Ajouter:
On rempli le formulaire comme ci dessus pour la création d’un service surveillance de la charge système d’un hôte.
On met la « Commande de vérification » sur la commande « check_nrpe« .
La variable PORT contient le port de service de NRPE, 5666.
La variable COMMAND contient la valeur « check_load« .
Cela correspond au nom de la commande sur le serveur cible (dans nrpe.cfg).
L’hôte que l’on souhaite monitorer doit donc avoir cette commande déclarer dans son fichier nrpe.cfg, comme on peut le voir ici:
vi /etc/nagios/nrpe.cfg
.....
command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20
......
Puis on va dans l’onglet « Relations » pour lié le modèle à des modèles d’hôtes:
On associe le modèle de service au modèle d’hôte qui fonctionneront avec NRPE comme ci-dessus. Il faudra reproduire la même chose pour chaque service NRPE que l’on désire configurer.
On peut maintenant créer dans Centreon notre première machine à monitorer avec notre service NRPE, « check_load« .
On installe sur le client Ubuntu le deamon NRPE ainsi que des scipts pour le monitorer:
apt-get install nagios-nrpe-server nagios-plugins
On va autoriser le serveur Centreon dans le fichier de configuration NRPE:
vi /etc/nagios/nrpe.cfg
allowed_hosts=127.0.0.1,192.168.122.58
Puis on démarre le service:
/etc/init.d/nagios-nrpe-server start
ou
systemctl start nagios-nrpe-server
On peut vérifier que le client Ubuntu répond au serveur Centreon avec cette commande (à faire depuis Centreon):
/usr/lib/nagios/plugins/check_nrpe -H 192.168.0.20 -c check_load
OK - load average: 0.06, 0.06, 0.01|load1=0.060;15.000;30.000;0; load5=0.060;10.000;25.000;0; load15=0.010;5.000;20.000;0;
On va maintenant déclarer la machine dans Centreon.
Pour cela on va dans Configuration / Hôtes et on clique sur le bouton ajouter
On rempli le formulaire en ayant spécifié le modèle d’hôte « Serveurs-Ubuntu« .
L’hôte va ainsi hérité du service NRPE que nous avons créer tout à l’heure.
On peut vérifié que le service pour la charge système est bien présent pour notre hôte Ubuntu à monitorer.
Pour cela on va dans Configuration / Services et on clique sur le service de notre hôte:
On vérifie que le « Modèle de service » que l’on souhaite, ici « NRPE_Charge_Système » que l’on a configurer précédemment est bien sélectionné.
On met la « Commande de vérification » sur « check_nrpe« .
On peut vérifier que cela fonctionne depuis le serveur Centreon avec cette commande:
/usr/lib/nagios/plugins/check_nrpe -H 192.168.0.20 -c check_load
Si tous est bon, il ne reste plus qu’a recharger la configuration du Collecteur:
Si il n’y à pas d’erreur, on coche également « Déplacer les fichier« , et « Redémarrer l’ordonnanceur »
Puis on clic sur exporter.
Pour installer le deamon NRPE, nous devons passer par les dépôts EPEL:
yum install epel-release -y
Puis
yum -y install nrpe nagios-plugin*
On va autoriser le serveur Centreon dans le fichier de configuration NRPE:
vi /etc/nagios/nrpe.cfg
allowed_hosts=127.0.0.1,192.168.122.58
Puis on démarre le service:
service nrpe start
chkconfig nrpe on
Particularité CentOS 7
systemctl restart nrpe
systemctl enable nrpe
firewall-cmd --permanent --add-port=5666/tcp
On va maintenant déclarer la machine CentOS dans Centreon.
En ayant spécifié le modèle d’hôte « Serveurs-CentOS« , l’hôte va ainsi hérité du service NRPE que nous avons créer tout à l’heure.
On peut vérifié que le service pour la charge système est bien présent pour notre hôte CentOS à monitorer.
Pour cela on va dans Configuration / Services et on clique sur le service de notre hôte:
On vérifie que le « Modèle de service » que l’on souhaite, ici « NRPE_Charge_Système » que l’on a configurer précédemment est bien sélectionné.
On vérifie que la « Commande de vérification » est bien « check_nrpe« .
On peut vérifier que cela fonctionne depuis le serveur Centreon avec cette commande:
/usr/lib/nagios/plugins/check_nrpe -H 192.168.122.172 -c check_load
Si tous est bon, il ne reste plus qu’a recharger la configuration du Collecteur:
Si il n’y à pas d’erreur, on coche également « Déplacer les fichier », et « Redémarrer l’ordonnanceur »
Puis on clic sur exporter.