Aller au contenu
Retour au glossaire
Contrats

Qu'est-ce que SLA (Service Level Agreement) ?

Un Service Level Agreement est un contrat qui quantifie l'engagement entre fournisseur et client, disponibilité, temps de réponse et remèdes.

Ce que contient vraiment un SLA

Un SLA met fin à la conversation « on fera de notre mieux » et la remplace par des chiffres. Un SLA sérieux définit :

  • Ce qui est mesuré : pages chargées, transactions complétées, endpoints API qui répondent, pas « la plateforme est en ligne ».
  • La cible : typiquement un pourcentage (99,9 %, 99,95 %, 99,99 %) pour la disponibilité, plus des cibles de latence (latence p95 sous 500 ms).
  • Comment c'est mesuré : depuis où, avec quel outil, sur quelle fenêtre temporelle. « Moyenne sur le mois » est très différent de « fenêtre glissante de 5 minutes ».
  • Les exclusions : maintenance planifiée, force majeure, pannes causées par le client.
  • Les remèdes : ce qui se passe quand la cible est ratée : avoirs, réduction de frais, droits d'escalade.

Sans ces cinq éléments, le SLA est décoratif.

Le piège des « trois neufs »

Les pages marketing adorent 99,9 % de disponibilité parce que ça rassure. En pratique, trois neufs autorisent :

  • 8 heures et 45 minutes d'indisponibilité par an.
  • 43 minutes par mois.
  • 1,4 minute par jour.

99,99 % (« quatre neufs ») réduit à 52 minutes par an, ce qui exige généralement un failover multi-région, des hot standbys et une équipe d'astreinte. La différence de coût entre trois et quatre neufs peut atteindre 10× l'investissement en ingénierie, donc la bonne question n'est pas « combien de neufs voulons-nous ? » mais « quel est le coût d'une heure d'indisponibilité pour l'entreprise, et quels neufs cela justifie-t-il ? »

Temps de réponse vs. temps de résolution

Deux métriques de SLA souvent confondues :

  • Temps de réponse : temps jusqu'à ce qu'un humain accuse réception de votre ticket d'incident.
  • Temps de résolution : temps jusqu'à ce que l'incident soit corrigé.

La plupart des fournisseurs s'engagent fermement sur la réponse, et plus mollement sur la résolution. C'est raisonnable : la résolution dépend de la nature du bug. Mais cela veut dire qu'un « SLA de 15 minutes » signifie généralement « vous aurez de nos nouvelles dans les 15 minutes », pas « ce sera réparé dans les 15 minutes ». Lisez le contrat.

Ce qu'engage le SLA Hidora

Notre offre SLA Expert est construite autour de trois engagements : réponse sous 15 minutes pour les incidents P1, procédures certifiées ISO 27001, et couverture d'astreinte qui ne dépend pas d'un accès permanent à votre infrastructure (utile quand les règles réglementaires l'interdisent). Pour une couverture opérationnelle complète incluant la résolution et la planification de capacité, voir Managed Services.