Qu'est ce que Nagios

Aller à : navigation, rechercher

Sommaire [1]

NagiosTM(anciennement appelé Netsaint) est une application permettant la surveillance système et réseau. Elle surveille les hôtes et services que vous spécifiez, vous alertant lorsque les systèmes vont mal et quand ils vont mieux. C'est un logiciel libre sous licence GPL.

C'est un programme modulaire qui se décompose en trois parties:

  1. Le moteur de l'application qui vient ordonnancer les tâches de supervision.
  2. L'interface web, qui permet d'avoir une vue d'ensemble du système d'information et des possibles anomalies.
  3. Les Plugin, une centaine de mini programmes que l'on peut compléter en fonction de nos besoins pour superviser chaque service ou ressource disponible sur l'ensemble des ordinateurs ou éléments réseaux de notre SI.

Possibilités

  • Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP , etc.)
  • Superviser les ressources des serveurs (charge du processeur, occupation du disque dur, utilisation de la mémoire paginée) et ceci sur les systèmes d'exploitations les plus répandus.
  • Interface avec le protocole SNMP
  • La supervision à distance peut utiliser SSH ou un tunnel SSL
  • Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche : scripts shell (Bash, ksh, etc...), C++, Perl, Python, Ruby, PHP, C#, etc...
  • La vérification des services se fait en parallèle.
  • La vérification des services se fait en parallèle.
  • Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.
  • La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins (alerte par email, SMS, etc...)
  • Acquittement des alertes par les administrateurs.
  • Gestion des escalades pour les alertes (une alerte non acquittée est envoyée à un groupe différent).
  • Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques éléments.
  • Capacité de gestion des oscillations (nombreux passages d'un état normal à un état d'erreur dans un temps court).
  • Chaque test renvoie un état particulier:
  1. OK (tout va bien)
  2. WARNING (le seuil d'alerte est dépassé)
  3. CRITICAL (le service a un problème)
  4. UNKNOWN (impossible de connaître l'état du service)