Run & Opérations
Rendre le run observable et actionnable : baselines, runbooks, ownership et routines opérationnelles comme modules réutilisables.
Le Platform Engineering ne consiste pas seulement à “livrer”. À l’échelle, le coût se situe souvent dans l’exécution : incidents, drift, ownership flou, runbooks non industrialisés.
La vision d’Argy : productiser le run.
- l’équipe plateforme définit des standards une fois,
- les équipes consomment ces standards par défaut,
- les outcomes restent observables.
Ce que “run automation” signifie dans Argy
Baselines d’observabilité
Plutôt que de demander à chaque équipe de réinventer dashboards et alert rules, un golden path peut embarquer :
- un set de dashboards “baseline”,
- de l’alerting actionnable,
- des cibles SLO et signaux d’error budget.
Runbooks comme partie du produit
Les runbooks ne doivent pas vivre dans un wiki isolé. Ils doivent être :
- liés au service,
- versionnés avec le golden path,
- orientés “pannes fréquentes”.
Ownership et escalade
L’automatisation opérationnelle ne fonctionne que si l’ownership est explicite :
- qui possède le produit,
- qui possède la partie plateforme,
- comment escalader.
Routines opérationnelles
Exemples de routines standardisables :
- checklist incident,
- patterns de rollback/safe deploy,
- templates de postmortem,
- baselines coûts/FinOps.
Pourquoi c’est crucial
Le run automation n’a pas pour but de “remplacer l’humain”. Il vise à :
- réduire la dette support,
- rendre les systèmes plus opérables,
- rendre la gouvernance mesurable.
Aller plus loin
- Sécurité et garde‑fous : Policies & garde‑fous
- Comment un module embarque le run : Concevoir des modules
- Scénarios orientés outcomes : Cas d’usage