IMA5 2018/2019 P31 : Supervision des serveurs de la plateforme informatique : Différence entre versions

De Wiki de Projets IMA
(Semaine 1)
(Résumé du travail effectué)
Ligne 98 : Ligne 98 :
 
====Lundi matin (4h):====
 
====Lundi matin (4h):====
 
* Rédaction du wiki
 
* Rédaction du wiki
* Installation de nagios sur la VM de superviosn '''"supervise"'''
+
* Installation de nagios sur la VM de supervision '''"supervise"'''
 
* Installation de NRPE sur baleine
 
* Installation de NRPE sur baleine
 
* Premier tests des plugins:
 
* Premier tests des plugins:
Ligne 111 : Ligne 111 :
 
====Vendredi (8h):====
 
====Vendredi (8h):====
 
* Mise en place d'un plugin de vérification de l'état des VMs
 
* Mise en place d'un plugin de vérification de l'état des VMs
* Résolution de problèmes pour NRPE (accès/droit des utilisateurs pour l’exécution de certain scripts)  
+
* Résolution de problèmes pour NRPE (accès/droit des utilisateurs pour l’exécution de certain scripts)
  
 
===Problèmes rencontrés et résolution===
 
===Problèmes rencontrés et résolution===

Version du 24 septembre 2018 à 09:23


Présentation générale

L'objectif du projet est de réaliser un tableau de bord affichant l'état des serveurs physiques et virtuels de la plateforme informatique.

Description

L'idée pour la réalisation du projet est de remonter l'état des machines physiques et virtuelles sur un serveur virtuel de supervision, serveur sur lequel on va trouver les applications web permettant la génération du tableau de bord ainsi que la gestion des tâches de sauvegarde des machines virtuelles.

Objectifs

Le projet s'articule autour de ces deux principaux objectifs:

  • Créer un serveur de supervision fonctionnel.
  • Mettre en place une solution pour la gestion automatique des sauvegardes des machines virtuelles.

Préparation du projet

Cahier des charges

Le système doit rapporter les points suivants :

  • état de santé des machines physiques : température, état des disques, ...
  • occupation des machines physiques : utilisation CPU, utilisation espace disque, utilisation mémoire
  • état de santé des connexions réseau : réseau Renater, réseau ADSL, réseau SDSL
  • état de santé des machines virtuelles : temps d\'exécution de chaque machine virtuelle
  • occupation des machines virtuelles : utilisation disque et mémoire
  • état de certaines applications critiques :
    • date de validité des clefs DNSSEC
    • dates des dernières sauvegardes des machines virtuelles
  • vérification des certificats https de sites web.
  • affichage de la température en salle serveur

La gestion des sauvegarde peut se faire au travers de scripts automatiques.

Choix techniques : matériel et logiciel

Pour la réalisation du serveur de supervision, l'idée consiste à se reposer sur une solution déjà existante: Nagios Core. En plus d'être facile à mettre en place, Nagios possède l'avantage de posséder les plugins et les sondes nécessaire au monitoring des machines virtuelles XenServeurs.

A cela, on peut aussi ajouter une communauté active mettant à disposition des plugins et addons sur la plateforme communautaire nagios exchange.

Une comparaison avec la solution zabbix devra éventuellement être effectué.

La surveillance des hôtes ainsi que des machines virtuelles sera assuré via un applicatif déployé sur les hôtes nommé NRPE:

Nagios-NRPE.jpeg

Cet agent permet de faire remonter à notre serveurs serveurs de monitoring (ici notre serveur nagios) le résultat de scripts lancé directement sur les hôtes.

Liste des tâches à effectuer

  • Dans un premier temps, il sera nécessaire de réaliser une phase de test sur les machines projet en salle E306, L'idée sera de monitorer un PC depuis un autre PC.
  • La deuxième étape consistera à installer la machine virtuelle et à mettre en place le serveur de supervision affichant l'état des machines physiques et virtuelles ainsi que des réseaux (réseau Renater, réseau ADSL, réseau SDSL) et effectuant la vérification des certificats https.
  • La troisième partie du projet sera consacré l'automatisation des tâches de sauvegardes des VMs.
  • Une fois cela fait, il faudra se concentrer sur la vérification des clefs DNSSEC.
  • Il a prévu par la suite de mettre en place un système de surveillance de température en salle serveur.
  • Toute autre tâche priorisé par Mr Redon et/ou Mr Vantroys.

Calendrier prévisionnel

Septembre:

  • Un serveur de supervision fonctionnel avec AU MOINS une partie des valeurs à monitorer.

Octobre:

  • Idéalement, avoir toutes valeurs à monitorer.
  • commencer à mettre en place les tâches de sauvegarde.

Novembre:

  • Avoir un serveur de supervision fonctionnel à 100 % avec toutes les valeurs à surveiller.
  • Idéalement, avoir des tâches de sauvegarde fonctionnelles.
  • Commencer à travailler sur la vérification des clefs DNSSEC.

Décembre:

  • Serveur de supervision et tâches de sauvegarde fonctionnelles à 100%.
  • Vérification des clefs DNSSEC en partie fonctionnelle.

Réalisation du Projet

Semaine 0

Durant cette semaine, 12h ont été consacré:

  • A de la documentation pour le choix de la solution à utiliser.
  • Réalisation de test sur les machines en salle E306.
  • Début de l'installation et/ou de la modification de plugins à utiliser avec NRPE pour monitorer certaines valeurs (Température).


Tests réalisé sur zabeth13 en surveillant zabeth15:

NagiosServer.jpg

Semaine 1

L'objectif durant cette semaine fut de mettre en place la supervision sur le serveur de sauvegarde baleine.

Résumé du travail effectué

Lundi matin (4h):

  • Rédaction du wiki
  • Installation de nagios sur la VM de supervision "supervise"
  • Installation de NRPE sur baleine
  • Premier tests des plugins:
    • check_load : test la surcharge du serveur.
    • check_mem : retourne la quantité de mémoire et SwAP disponible sur le serveur
    • check_disk : retourne la quantité d'espace de stockage disponible

Jeudi (8h):

  • Mise en place d'un plugin vérification de température du processeur
  • Création d'un plugin de vérification d'état de santé des disques

Vendredi (8h):

  • Mise en place d'un plugin de vérification de l'état des VMs
  • Résolution de problèmes pour NRPE (accès/droit des utilisateurs pour l’exécution de certain scripts)

Problèmes rencontrés et résolution

Déploiement NRPE & Configuration de Nagios

Semaine 2

Documents Rendus