Aller au contenu
DevOps
Blog
DevOps8 min

Le coût réel du downtime : cas pour la direction

Matthieu Robin14 août 2025

Vous avez eu un incident hier. 45 minutes de downtime. Votre système était hors service. Personne ne pouvait accéder à l'application.

Votre CEO demande : "Combien ça nous a coûté ?"

Vous répondez : "...je ne sais pas exactement ?"

C'est un problème. Non seulement vous ne connaissez pas les coûts, mais votre direction ne va pas investir en infrastructure pour prévenir le downtime si vous ne pouvez pas quantifier le problème.

Voici comment calculer le vrai coût et pourquoi investir en SLA/monitoring est une évidence économique.

Approche pour calculer le coût du downtime

Il y a plusieurs composantes :

1. Revenu perdu direct

Si votre modèle économique repose sur les transactions, c'est facile :

Exemple : Plateforme de commerce électronique

  • 10 000 visites par jour
  • 2 % de taux de conversion = 200 commandes/jour
  • Panier moyen = CHF 150
  • Revenu/jour = CHF 30 000
  • Revenu/minute = CHF 30 000 / (24 × 60) = CHF 20.83/minute
  • 45 minutes de downtime = CHF 937 de revenu perdu

Mais la plupart des entreprises n'ont pas une conversion linéaire avec le temps. Cela dépend de la nature du service.

Autres exemples :

  • SaaS par abonnement : impact limité (les utilisateurs ne peuvent pas utiliser le service pendant le downtime, mais ont payé leur abonnement mensuel)
  • Service de streaming : impact fort (les utilisateurs qui ne peuvent pas regarder ne génèrent aucun revenu, et leur frustration augmente)
  • API service B2B : dépend du SLA (si vous ne respectez pas votre SLA de 99.9 %, vous avez des pénalités)

2. Coûts de mitigation et de recovery

Pendant et après un incident :

  • Responsable d'incident (CTO ou ingénieur senior) qui lâche tout = CHF 200-500 en coût d'opportunité
  • Ingénieurs retirés d'autres projets = CHF 100-300 par personne
  • Escalade (appels avec les clients, heures supplémentaires du support) = CHF 500-2 000
  • Post-mortem (3-4 heures d'analyse par l'équipe ingénierie) = CHF 1 000-2 000
  • Correctif + tests si un patch est nécessaire = CHF 2 000-10 000

Total par incident : CHF 3 700-14 500

3. Perte de clients

Pire que le revenu perdu direct. Les clients qui subissent du downtime rétrogradent, annulent, ou migrent chez un concurrent.

Métrique importante : Combien de clients partent après un incident ?

Pour une entreprise SaaS, même 1-2 % de taux d'attrition sur un incident de 45 minutes, c'est énorme :

  • 500 clients
  • 1 % d'attrition = 5 clients
  • Valeur à vie d'un client = CHF 50 000 (3 ans × CHF 16k/an)
  • Valeur perdue = CHF 250 000

Oui, 45 minutes peuvent coûter CHF 250 000 en revenus futurs perdus.

4. Dommage à la réputation

C'est difficile à quantifier mais réel. Si vous êtes une startup B2B, une panne qui vous laisse hors service pendant une heure, c'est une histoire que le CTO d'un prospect va entendre. "On envisageait cette solution, mais ils ont eu une panne horrible en août, on a choisi un autre prestataire."

Coût réputationnel : CHF 50 000-500 000 selon votre présence sur le marché et la visibilité de l'incident.

Calcul total : un incident de 45 minutes

Composante Coût
Revenu perdu direct CHF 937
Coûts de réponse à l'incident CHF 8 000
Perte de clients (1 % sur 500) CHF 250 000
Dommage à la réputation CHF 100 000
TOTAL CHF 358 937

Par minute : CHF 7 976/minute.

C'est pour une entreprise de taille moyenne avec 500 clients. Si vous êtes une grande banque ? Multipliez par 10 minimum.

Impact par secteur : le downtime ne coûte pas la même chose partout

Le coût du downtime varie drastiquement selon l'industrie. Voici des exemples concrets pour des entreprises suisses :

Fintech / Banking : Une plateforme de trading qui tombe pendant 30 minutes un jour de forte volatilité peut perdre CHF 500,000-2,000,000 en transactions manquées. Sans compter les pénalités réglementaires FINMA si les systèmes de reporting sont impactés. Les grandes banques suisses estiment que certains incidents IT leur coûtent plusieurs millions par heure.

E-commerce / Retail : Pendant le Black Friday ou les soldes, une boutique en ligne suisse générant CHF 5M/an peut perdre CHF 15,000-20,000 par heure de downtime. Pire : 79% des acheteurs qui subissent un downtime ne reviennent pas acheter dans les 30 jours suivants.

SaaS B2B : Pour une plateforme SaaS avec des clients enterprise, un incident de 2 heures déclenche des pénalités SLA (souvent 10-25% du contrat mensuel) et des escalations au C-level chez le client. Trois incidents en 6 mois et vous perdez le renouvellement.

Santé / MedTech : Au-delà du coût financier, un système hospitalier down met des vies en danger. Les amendes réglementaires en Suisse pour non-disponibilité de systèmes critiques peuvent atteindre CHF 250,000 par incident.

Industrie / Manufacturing : Une ligne de production connectée à un ERP cloud qui tombe, c'est CHF 5,000-50,000 par heure d'arrêt de production, plus le coût de redémarrage des machines.

Business case : investir en SLA et monitoring

Maintenant vous savez : un incident de 45 minutes coûte CHF 358 000.

Voici ce que vous pouvez faire :

Option A : Service managé (Hikube.cloud)

Vous externalisez votre infrastructure auprès d'un MSP qui garantit un SLA de 99.9 %.

Coût :

  • Kubernetes managé : CHF 150 000/an
  • Garanties SLA : CHF 50 000/an (premium pour la fiabilité)
  • Total : CHF 200 000/an

Bénéfice :

  • SLA 99.9 % = max 43 minutes de downtime par an
  • Contre une entreprise moyenne qui a 5-10 incidents par an de 30-60 minutes chacun = 2,5-10 heures/an

Vous passez donc de 2,5-10 heures de downtime/an à 43 minutes/an.

Coût des incidents évités :

  • Hypothèse : 7 incidents par an
  • Moyenne de CHF 300 000 par incident (en pondérant certains incidents mineurs)
  • Total évité = CHF 2 100 000/an

ROI :

  • Coût : CHF 200 000
  • Bénéfice : CHF 2 100 000
  • Gain net : CHF 1 900 000/an = ROI de 10,5x

Délai de rentabilité : 1 mois.

Option B : Meilleur monitoring (en interne)

Vous ne changez pas votre infrastructure, mais vous investissez en monitoring et en pratiques SRE.

Coût :

  • Prometheus + Grafana + Datadog : CHF 60 000/an
  • 1,5 ETP SRE (personne dédiée à la fiabilité) : CHF 150 000/an
  • Automatisation des incidents (PagerDuty, auto-remédiation) : CHF 30 000/an
  • Total : CHF 240 000/an

Bénéfice :

  • Réduction du MTTR (temps moyen de résolution) de 30 minutes en moyenne à 5 minutes
  • Réduction de la fréquence des incidents de 7/an à 3/an (grâce à de meilleures alertes et une meilleure prévention)

Économies :

  • 7 incidents -> 3 incidents par an = 4 incidents évités
  • CHF 300 000 par incident
  • Total : CHF 1 200 000/an

ROI :

  • Coût : CHF 240 000
  • Bénéfice : CHF 1 200 000
  • Gain net : CHF 960 000/an = ROI de 5x

Délai de rentabilité : 2,4 mois.

Comparaison de scénarios

Métrique Actuel Option A (Managé) Option B (Monitoring)
Downtime par an 5 heures 43 minutes 1,5 heures
Incidents par an 7 1 3
Coût par incident CHF 358k CHF 50k (pénalité SLA) CHF 300k
Coût annuel 0 CHF 200k CHF 240k
Coût annuel des incidents CHF 2,5M CHF 50k CHF 900k
Coût net par an CHF 2,5M CHF 250k CHF 1,14M

Les options A et B sont TOUTES DEUX bien moins chères que de ne rien faire.

Quoi présenter à votre CFO/CEO

Vous ne parlez pas de pourcentages de disponibilité. Vous parlez de revenus et de risque :

"Nous avons actuellement ~7 incidents par an, durée moyenne 40 minutes. Chaque incident coûte entre CHF 200k-400k en revenu perdu + perte de clients + réponse aux incidents. C'est CHF 1,5-2,5M par an de risque.

Pour CHF 200k/an, un MSP peut nous garantir un SLA de 99.9 % (1 incident par an maximum). Ou nous pouvons investir CHF 240k en monitoring et pratiques SRE.

L'option A économise CHF 1,5-2,3M par an. Rentabilité : 1 mois. L'option B économise CHF 1,2-1,6M par an. Rentabilité : 2,4 mois.

Ne pas investir, c'est l'option la plus coûteuse."

À ce point, votre CFO va dire oui. Il/elle comprend le risque sur le revenu.

Métriques à suivre pour justifier l'investissement

Une fois que vous avez investi, vous devez suivre :

  1. Pourcentage de disponibilité. Cible : 99,5 % minimum (4 heures de downtime/an), 99,9 % idéalement (43 min/an).

  2. MTTR (temps moyen de résolution). Cible : < 15 minutes pour les incidents critiques. Vous devez réduire le temps de détection + le temps de correction.

  3. Fréquence des incidents. Cible : < 2 incidents par mois. Si vous en avez plus, quelque chose ne va pas.

  4. Coût des incidents. Suivez chaque incident : revenu perdu, perte de clients, coût de la réponse. Rapport mensuel.

  5. Pénalités SLA. Si vous utilisez un service managé avec SLA, mesurez si vous respectez les garanties.

Attention : le piège de l'optimisation à outrance de la disponibilité

Un point important : il y a des rendements décroissants. 99,0 % = 7,2 heures de downtime/an. 99,9 % = 43 min/an. 99,99 % = 4,3 min/an.

Chaque "9" coûte de plus en plus cher. 99,99 % peut vous coûter CHF 500k+ avec la redondance, le disaster recovery, etc.

Règle : Alignez votre cible sur votre impact business. Un e-commerce ? 99,9 %. Un CRM interne ? 99,0 % suffit. Un système hospitalier ? 99,99 %.

En résumé

Le downtime n'est pas un "problème technique". C'est un problème de revenus.

Un incident de 45 minutes = CHF 300k-400k de coûts en moyenne. Sur une année, c'est CHF 2,5M de risque.

Investir CHF 200k-240k en services managés ou en monitoring/SRE = CHF 1,2-2,3M d'économies par an.

C'est l'un des business cases les plus simples à présenter à votre direction. Un ROI de 5-10x, une rentabilité en 1-2 mois, et c'est transparent pour le métier (vous ne changez rien aux applications, juste l'infrastructure).

Si vous ne le faites pas, vous laissez un revenu considérable sur la table.

À lire aussi :


Cet article vous a été utile ? Découvrez comment Hidora peut vous accompagner : Professional Services · Managed Services · SLA Expert

Matthieu Robin
Matthieu Robin

CEO & Co-fondateur

Fondateur de Hidora, passionné par le cloud natif et la souveraineté numérique suisse. Plus de 15 ans dans l'écosystème cloud.

Cet article vous parle ?

Hidora peut vous accompagner sur ce sujet.

Besoin d'un accompagnement ?

Parlons de votre projet. 30 minutes, sans engagement.