Services
Il faudrait définir plus précisemment ce qu'on entends par là : le service au sens systemd du terme (qu'il faudrait donc multiplier par le nombre de container), ou le service rendu par le serveur, donc : accède-t-on bien au forum/au wiki ...
Expiration certificat SSL
Ressources (pour chaque containaier ou pas ? )
* Espace disque
* Utilisation mémoire
* Utilisation CPU
Services
Il faudrait définir plus précisemment ce qu'on entends par là : le service au sens systemd du terme (qu'il faudrait donc multiplier par le nombre de container), ou le service rendu par le serveur, donc : accède-t-on bien au forum/au wiki ...
* Expiration certificat SSL
À mon avis pour les ressources "physiques" (CPU, mémoire, espace de stockage) une surveillance au niveau de l’hôte peut être suffisante, et sera plus simple à mettre en place qu’une surveillance au niveau des conteneurs.
À mon avis pour les ressources "physiques" (CPU, mémoire, espace de stockage) une surveillance au niveau de l’hôte peut être suffisante, et sera plus simple à mettre en place qu’une surveillance au niveau des conteneurs.
Je pense également qu'il n'est pas nécessaire pour l'instant de monitorer les ressources /physiques/ de chaque conteneur individuellement. Il sera toujours temps de le rajouter par la suite si c'est une information qui nous manque pour le diagnostic.
Pour les services à surveiller, je pensais surtout au sens « service rendu par le serveur », donc effectivement, l'accès aux différents alias/vhosts, la vérification des certificats, mais aussi le ping, la présence de ssh (sur un port à décider), smtp, dovecot. Pour smtp (postfix), il est important d'avoir le nombre de mails reçus/envoyés, pour être sûr qu'on n'a pas de pb… À noter que pour l'instant les rapports dmarc sont envoyés chez moi, mais ce serait bien si on pouvait les traiter automatiquement sur le serveur…
Je pense également qu'il n'est pas nécessaire pour l'instant de monitorer les ressources /physiques/ de chaque conteneur individuellement. Il sera toujours temps de le rajouter par la suite si c'est une information qui nous manque pour le diagnostic.
Pour les services à surveiller, je pensais surtout au sens « service rendu par le serveur », donc effectivement, l'accès aux différents alias/vhosts, la vérification des certificats, mais aussi le ping, la présence de ssh (sur un port à décider), smtp, dovecot. Pour smtp (postfix), il est important d'avoir le nombre de mails reçus/envoyés, pour être sûr qu'on n'a pas de pb… À noter que pour l'instant les rapports dmarc sont envoyés chez moi, mais ce serait bien si on pouvait les traiter automatiquement sur le serveur…
TODO
Ressources (pour chaque containaier ou pas ? )
Services
Il faudrait définir plus précisemment ce qu'on entends par là : le service au sens systemd du terme (qu'il faudrait donc multiplier par le nombre de container), ou le service rendu par le serveur, donc : accède-t-on bien au forum/au wiki ...
À mon avis pour les ressources "physiques" (CPU, mémoire, espace de stockage) une surveillance au niveau de l’hôte peut être suffisante, et sera plus simple à mettre en place qu’une surveillance au niveau des conteneurs.
Je pense également qu'il n'est pas nécessaire pour l'instant de monitorer les ressources /physiques/ de chaque conteneur individuellement. Il sera toujours temps de le rajouter par la suite si c'est une information qui nous manque pour le diagnostic.
Pour les services à surveiller, je pensais surtout au sens « service rendu par le serveur », donc effectivement, l'accès aux différents alias/vhosts, la vérification des certificats, mais aussi le ping, la présence de ssh (sur un port à décider), smtp, dovecot. Pour smtp (postfix), il est important d'avoir le nombre de mails reçus/envoyés, pour être sûr qu'on n'a pas de pb… À noter que pour l'instant les rapports dmarc sont envoyés chez moi, mais ce serait bien si on pouvait les traiter automatiquement sur le serveur…
Bon, si on résume :
*
A editer si j'oublie des trucs.
On ouvre un ticket par point du coup, par gros point ou en détail ?
Un par gros points, avec des cases à cocher cochées au fur et à mesure que c'est monitoré ?
Fait
Du coup, on continue sur Netdata ou pas ?
Je n'ai pas d'objection technique :-)
@vv222 qu'en penses-tu ? Tu en parles à nos amis mangeurs de guimauve ?
A priori, tout est listé dans #5 , #6 , #8 , #9
Ne pas hésiter à editer ces tickets s'il manque des trucs.