Aller au contenu
Retour au glossaire
Observabilité

Qu'est-ce que Grafana ?

Grafana est la plateforme open-source standard pour visualiser des métriques, des logs et des traces. Dashboards interactifs, alerting unifié, multi-sources de données.

À quoi sert Grafana

Grafana est l'outil de visualisation et d'analyse open-source de référence dans l'écosystème observabilité. Créé en 2014 par Torkel Ödegaard, racheté par Grafana Labs, il s'est imposé comme l'interface universelle pour explorer les données de monitoring sans imposer une base de données particulière. Concrètement, Grafana ne stocke pas vos données : il se branche sur Prometheus, Loki, Elasticsearch, PostgreSQL, ClickHouse, Tempo et une trentaine d'autres sources, et construit des dashboards qui unifient la vue.

Pour une équipe DevOps, Grafana remplit trois rôles distincts : explorer librement des métriques en mode ad hoc (PromQL, LogQL, SQL selon la source), assembler des dashboards partageables pour le suivi opérationnel, et déclencher des alertes basées sur des seuils ou des conditions complexes.

Les trois piliers d'observabilité dans Grafana

Depuis la version 8 (2021), Grafana a unifié les trois piliers de l'observabilité dans une seule interface :

  • Métriques via Prometheus, Mimir, Graphite ou InfluxDB. Vue temporelle des compteurs, jauges, histogrammes.
  • Logs via Loki, Elasticsearch ou Splunk. Recherche textuelle, filtrage par label, corrélation avec les métriques.
  • Traces via Tempo, Jaeger ou Zipkin. Visualisation des requêtes distribuées avec leurs spans.

Le bénéfice opérationnel : pendant un incident, un ingénieur d'astreinte clique sur un pic de latence dans un dashboard, navigue vers les logs concernés du même service, et remonte la trace distribuée pour identifier la cause racine. Tout sans changer d'outil.

Grafana vs solutions propriétaires

Comparé à Datadog, New Relic ou Splunk, Grafana joue la carte de la portabilité : pas de format propriétaire, pas de lock-in, données stockées où vous voulez. Cette flexibilité a un coût : il faut composer la stack soi-même (Prometheus + Loki + Tempo + Grafana) plutôt que de souscrire à une plateforme intégrée.

Pour une PME suisse, l'arbitrage typique se joue entre 500 et 2 000 CHF/mois (stack open-source auto-hébergée) et 3 000 à 15 000 CHF/mois (SaaS propriétaire). Pour les organisations soumises à la souveraineté des données, l'auto-hébergement reste souvent le seul choix viable. Grafana Cloud (offre SaaS de Grafana Labs) propose une alternative hybride avec hébergement européen, plus adaptée aux contraintes nLPD/RGPD.

Alerting unifié

Depuis la version 9, Grafana propose un système d'alerting unifié qui remplace les notifications éparpillées entre Prometheus Alertmanager, ElastAlert et autres outils par source. Une règle Grafana peut évaluer plusieurs sources de données simultanément (par exemple : latence Prometheus ET taux d'erreur dans les logs Loki) et router vers Slack, PagerDuty, Microsoft Teams, ou un webhook custom.

Sur les missions Hidora, nous configurons systématiquement Alertmanager pour les alertes Prometheus natives et Grafana alerting pour les corrélations multi-sources. Les deux cohabitent sans conflit.

Quand Grafana n'est pas adapté

Grafana est conçu pour des dashboards opérationnels (10 à 100 utilisateurs simultanés). Pour des dashboards à grande échelle (clients externes, plusieurs milliers de vues mensuelles), il devient lourd et coûteux à scaler. Dans ce cas, des solutions comme Apache Superset ou Metabase, dédiées à l'analytique self-service, sont plus appropriées.

Services Hidora associés

  • Managed Services : déploiement et exploitation 24/7 d'une stack Grafana + Prometheus + Loki + Tempo, avec dashboards standardisés par environnement client.
  • Consulting : conception de la stratégie observabilité, choix entre Grafana open-source et Grafana Cloud, définition des SLI/SLO côté dashboards.
  • Prometheus, Observabilité, SRE : briques associées dans la chaîne d'observabilité moderne.