Suivre

Chaque fois que tout est au vert dans la supervision, je me demande si la supervision fonctionne correctement…

@framasky @Enky
Un Nagios qui check si les process Nagios tournent sur l'autre serveur ?

@maxence @Enky J'crois que la dernière fois que la supervision a planté, c'était pas les processus qui étaient par terre mais la communication entre les deux shinken qui était tombée.

@framasky @Enky
C'est effectivement plus courant qu'un Nagios/Shinken/whatever qui crash

@Enky @framasky

Après, il faut choisir entre se réveillé pour un faux positif (erreur ponctuelle de communication ou autre) ou ne pas monitorer le monitoring avec le risque de le perdre sans savoir.

@maxence @Enky Mec. Tu crois que je suis réveillé par la supervision ? Y a pas d'astreinte chez Framasoft 😁

@maxence @Enky C'est un choix : on n'a encore de quoi payer un 2ème adminSys et mettre en place un système d'astreinte. Et puis au final, on n'a pas trop à rougir, quand on regarde notre uptime. Surtout ces derniers temps, depuis quelques changements de serveur.

@Enky @maxence Les astreintes, c'est pour les faibles qui n'ont pas confiance en leur infra :troll:

@maxence @Enky Ceci dit, avec le bug Intel, je sens bien qu'on va devoir prendre des serveurs plus costauds pour la virtu 🙁

@framasky @Enky
J'ai mal à mes serveurs ! (et encore plus à la virtu qui en a déjà à raz la gueule)

@maxence @framasky @Enky j'ai le même problème à la maison, j'ai peur des patchs qui vont arriver, je viens juste d'ajouter un neud à notre cluster pour sortir du rouge et je pense que tout ça vas nous y renvoyer...

@framasky @Enky
C'est vrai que votre infra a l'air bien huilée 👌

Il me semble qu'il faut être au minimum 3 personnes pour assurer des astreintes 24/7 (avec un roulement tous les 7 jours)

@Enky @maxence Ah ouais mais jamais j'accepte ça, moi. Ceci dit, Framasoft ne me le demandera jamais non plus (on a un comité Relations Humaines, pas Ressources Humaines).

@framasky @Enky @maxence quand tu poses tes conditions et qu'on te dis oui, c'est plus facile d'accepter ;)

@Enky @maxence Bah ouais mais… les conditions que je voudrais poser sont déjà remplies, je fais comment ? 😛

@framasky @Enky @maxence demande plus : Jaguar de fonction, service de garde de chat pour les vacances, stock options ;)

@Enky @maxence Les donateurs seront ravis de savoir qu'ils me payent une jag' de fonction 😉 (sans compter que j'en aurai pas des masses l'usage)

@framasky @Enky

C'est important, d'avoir une jaguar pour aller faire les courses :P

@maxence @Enky J'vais faire mes courses à pied : j'habite à moins de 100 mètres d'un supermarché (+ médiathèque, pharmacie, banques, boulangerie, marché…)

@Enky @framasky

Outch... Ça doit être dur l'astreinte tout seul !

@framasky @maxence @Enky ya pas à dire, niveau qualité de service vous vous posez là.

J'ai du mal à me souvenir de la dernière fois où j'ai eu un soucis.

Merci ;)

@Enky @maxence Oh, y en a, y en a, mais là, ces derniers temps, ça baigne, c'est un vrai plaisir.

@maxence @framasky @Enky tout dépend de comment béton système de monitoring fonctionne.

Tu peux regarder la date de la dernière remonté d'information dans ton nagios/centres/whatever avec un autre outils et si il n'y a rien de nouveau depuis X minutes tu remontes une alerte.

@Enky @framasky

Oui, c'est plus évolué que regarder si le process tourne !

@framasky c'est pour ça que je laisse toujours quelques services en rade pour voir si tout va bien ! #ProTip

Inscrivez-vous pour prendre part à la conversation
Framapiaf

Framapiaf est un service de microblog similaire à Twitter. Il est libre, décentralisé et fédéré. Il permet de courts messages (max. 500 caractères), de définir leur degré de confidentialité et de suivre les membres du réseau sans publicité ni pistage.