Retour aux projets

Projet 5

Supervision avec Zabbix

Le problème que je voulais résoudre

J'avais une infrastructure de plus en plus complète — pare-feux, contrôleurs de domaine, serveurs — mais aucune visibilité. Si un service tombait, je le découvrais par hasard. Il fallait savoir, en un coup d'œil, si l'infrastructure va bien.

Mon raisonnement

Je voulais une supervision orientée service, pas seulement machine. Exemple concret : les adresses virtuelles CARP de mes pare-feux ne sont liées à aucune machine physique — c'est le pare-feu actif qui répond. Superviser « est-ce que le pfSense Master tourne » ne suffit pas ; ce qui compte, c'est « est-ce que le réseau répond ». J'ai donc créé une supervision dédiée à ces adresses virtuelles.

Ce que j'ai mis en place

  • Zabbix 7.2 sur Ubuntu Server, base MariaDB déportée, accès web en HTTPS via le certificat de la PKI interne, authentification LDAPS vers l'AD.
  • Supervision des serveurs Windows via agent, des pfSense via SNMP.
  • Une découverte réseau automatique : Zabbix scanne les plages d'IP et attache le bon modèle de supervision selon le type de machine (Windows ou Linux).
  • Des éléments et déclencheurs personnalisés pour les cas que les modèles standard ne couvrent pas : les cinq adresses virtuelles CARP, et l'état de la réplication Active Directory.
Interface Zabbix — liste des hôtes supervisés : DC01, DC02, pfSense-Master et pfSense-Backup (via SNMP, modèle 'pfSense by SNMP'), et le serveur Zabbix lui-même.
Zabbix — les hôtes supervisés : les deux contrôleurs de domaine via agent, les deux pfSense via SNMP avec leur modèle dédié.

Un déclencheur concret

DéclencheurConditionSignification
VIP FSEC.SRV indisponible le ping de 10.10.20.1 ne répond plus Plus aucun pfSense ne répond sur le segment serveurs
Erreur de réplication AD le compteur d'erreurs de réplication passe au-dessus de 0 La synchro entre DC01 et DC02 est en échec

Comment j'ai validé

J'ai simulé les pannes : extinction des deux pfSense → les déclencheurs VIP passent en PROBLÈME ; arrêt de DC02 → le déclencheur de réplication se déclenche. La supervision réagit bien aux scénarios réels.

Outils
  • Zabbix 7.2
  • Agents
  • SNMP
  • Découverte réseau
  • Déclencheurs
  • MariaDB
  • LDAPS