Facebook EmaiInACirclel
Cloud – big data

Supervision informatique, vers une disponibilité 100%

PentaGuy
PentaGuy
Blogger

Dirigeants et DSI-CTO doivent avoir l’obsession de la disponibilité de leurs services en ligne. L’un, car cela rentre dans la satisfaction client ; l’autre, car il est un levier de création de valeurs et sans la disponibilité l’effet est inverse.

Viser les 100% de disponibilité ne doit pas être un vœu pieux mais se traduire par des actions à plusieurs niveaux.

supervision-monitoring-room

Un environnement adapté

Une solution disponible à 100% sans attention n’est qu’une illusion, il faut traiter l’exigence à différents niveaux :

  • Continuité Internet  : s’assurer de la résilience des opérateurs télécom (BGP, multi-homing) pour supporter la rupture de liens.
  • Redondance matériel : s’assurer qu’il n’y a pas de SPF (Single Point of Failure). La redondance doit être partout.
  • Architecture robuste : s’assurer que l’intégration des briques logiques aient été faites dans un contexte permettant la montée en charge.

Pour réussir sa stratégie Cloud, il faut assurer une stabilité des ressources indispensables (réseau local, accès internet, …). La fiabilisation de ces services est un point de départ incontournable pour réussir l’externalisation vers des services Cloud. C’est le point de départ pour atteindre une disponibilité 100%.

Sur la recherche de cette très haute disponibilité, la première étape consiste donc à mettre en oeuvre un monitoring d’applications, d’infrastructure avec des mesures de disponibilité et de charge sur l’ensemble de ces ressources puis la mise en place de l’outillage adapté.

Une supervision efficace et adaptée

La mise en place d’un service de monitoring ne peut se limiter à la mise en place d’outils. Avec une redondance à tous les niveaux, la défaillance d’équipements est amortie. Mais l’imprévisible existera toujours et il faut anticiper ces cas. L’outil permet d’alerter pour une intervention immédiate selon le processus implémenté :

  • Prise en compte de l’alerte du système de supervision (arrêt de la sirène hurlante)
  • Dispatch de l’incident vers la bonne équipe / ressource
  • Exécution de la procédure prévue pour le problème identifié
  • Intervention d’un expert si le problème n’est pas connu dans les procédures (et documentation si nécessaire)

Cette approche en niveaux permet d’assurer une intervention efficace. Evidemment dans des environnements plus modestes, tous ces niveaux peuvent sembler injustifiés mais cette approche de bonnes pratiques ITIL limite les erreurs.

Pour optimiser ces pratiques de supervision, il est nécessaire de bien connaître les pratiques des usagers / clients pour assurer une disponibilité adaptée aux plages horaires d’utilisation. Pourquoi assurer une disponibilité H24/J7 quand le service n’est utilisé que dans les horaires de bureaux ?

Pentalog vous propose un monitoring de la performance 24 heures sur 24 et 7 jours sur 7.

Internaliser ou Externaliser ?

L’organisation d’une supervision consiste à assurer des interventions en heures ouvrées et mettre en place une organisation « Best Effort » en mode astreinte pour le reste du temps (nuit et week-end). Le mode « Best Effort » (rémunéré ou pas) a ses limites. Le choix entre monter une équipe pour assurer la supervision en heures non ouvrées et l’externalisation dépend de plusieurs critères. Cependant, pour un monitoring H24/J7, l’externalisation est rapidement incontournable :

  • La supervision n’est pas le cœur de métier de l’entreprise.
  • Les activités supervisées touchent peu à la confidentialité.
  • Les services stables permettent de contenir le budget de monitoring avec une organisation mutualisée.
  • Le transfert de l’effort de supervision interne en pilotage de l’externalisation est nécessaire.

Le modèle d’externalisation flexible me parait le plus adapté pour répondre à l’imprévisible et à une bonne gestion des risques :

  • Une équipe externalisée connaît les services et leur criticité.
  • L’externalisation peut ne porter que sur les heures non ouvrées.
  • Pour les absences imprévues ou les périodes de vacances, l’équipe externe peut assurer le relai sur les heures ouvrées.

Choisir un partenaire de confiance

Que cela soit pour du monitoring Cloud public, de serveurs, d’applications, d’une infrastructure, une externalisation ne peut pas se faire sans confiance. Attention à bien prendre quelques précautions pour éviter la confiance aveugle :

  • Bien délimiter les périmètres de responsabilité et les processus au sein d’un PQP (Plan Qualité Projet).
  • Avoir une attention particulière au contrat et à la clause de réversibilité.
  • Assurer une communication et un pilotage réguliers pour maintenir la proximité.
  • Mettre en place de l’authentification individuelle sur les systèmes pour une traçabilité des opérations.

Quelle entreprise pourrait se targuer aujourd’hui qu’une indisponibilité de son système d’information ou de services en ligne n’a pas de conséquences sur son activité ou son image de marque ? Et cela ne va pas aller en s’arrangeant. Le 100% devient de plus en plus un objectif et les derniers centièmes sont difficiles à atteindre.

Dans une démarche de continuité des services, Pentalog apporte à ses clients des services d’accompagnement dans la mise en place de services robustes ainsi que des services de supervision flexibles avec une équipe mutualisée.

Contactez-moi afin d’échanger sur les solutions possibles répondant à vos exigences.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *