Cloud Site Reliability Engineering
Certification européenne validant la maîtrise des pratiques SRE pour garantir fiabilité, disponibilité et performance des systèmes cloud en production.
Compétences clés
- ✓Conception et implémentation de SLI/SLO/SLA
- ✓Automatisation des opérations et toil reduction
- ✓Observabilité avancée et incident management
- ✓Chaos engineering et disaster recovery
Équivalences de marché
Cette certification PROVA couvre le périmètre de compétences attendu par les certifications suivantes :
Est-ce fait pour vous ?
✓ Cette certification est faite pour vous si :
- →Ingénieurs SRE confirmés souhaitant valider leurs compétences
- →DevOps Engineers évoluant vers des responsabilités de fiabilité
- →Architectes cloud responsables de la disponibilité des services
✗ Cette certification n'est pas adaptée si :
- →Débutants en administration systèmes sans expérience cloud → orienter vers PROVA Cloud Foundations
- →Architectes cloud seniors cherchant validation stratégique → orienter vers PROVA Cloud Architecture Master 801
Prérequis & conditions d'accès
Inscription en ligne, paiement par CB ou virement, vérification d'identité lors du proctoring.
Options d'achat
Voucher d'examen, parcours LMS, packs économiques — composez votre panier
Options d'achat
Composez votre parcours — voucher d'examen, préparation LMS, packs entreprise.
Compétences évaluées
SLI/SLO/SLA
Définir et monitorer les indicateurs de fiabilité alignés avec les objectifs business.
Automatisation
Réduire le toil opérationnel par l'Infrastructure as Code et le self-healing.
Observabilité
Implémenter logging, metrics, tracing distribué et alerting intelligent.
Résilience
Conduire chaos engineering et orchestrer les incidents critiques en production.
Format de l'examen
Programme
Fondamentaux SRE et service level management
Philosophie et origines du SRE, différences avec DevOps traditionnel, concept d'error budget et arbitrage vélocité/stabilité, définition et calcul de SLI (Service Level Indicators), conception de SLO (Service Level Objectives) alignés business, rédaction de SLA (Service Level Agreements), identification et mesure du toil, culture blameless et psychological safety, organisation des astreintes et on-call rotations, classification de sévérité d'incidents, communication de crise.
Observabilité et monitoring distribué
Différence monitoring vs observabilité, les trois piliers (logs, metrics, traces), architecture Prometheus et PromQL avancé, visualisation Grafana et dashboard design, stack ELK/EFK pour log management, distributed tracing avec Jaeger et Tempo, instrumentation OpenTelemetry, golden signals (latency, traffic, errors, saturation), stratégies d'alerting et réduction du bruit, corrélation multi-sources, observability-driven development.
Automatisation et Infrastructure as Code
Principes Infrastructure as Code, Terraform pour multi-cloud provisioning, state management et remote backends, Ansible pour configuration management, GitOps avec ArgoCD et FluxCD, pipelines CI/CD pour infrastructure, testing d'infrastructure (Terratest, InSpec), policy as code avec Open Policy Agent, self-healing patterns, automated remediation, runbook automation, secrets management (Vault, SOPS).
Résilience et gestion d'incidents
Principes de chaos engineering, Chaos Monkey et Simian Army, Litmus Chaos pour Kubernetes, game days et exercices de résilience, disaster recovery planning, calcul et optimisation RTO/RPO, backup strategies multi-région, incident response framework, war rooms virtuelles, post-mortem structure et facilitation, action items tracking, capacity planning et forecasting, performance testing (load, stress, soak).
Comment financer votre certification
3 solutions pour couvrir le coût de votre certification
OPCO — Prise en charge employeur
Demandez à votre employeur une prise en charge via votre OPCO (plan de développement des compétences).
Personnel — 450€ TTC
Paiement en ligne sécurisé par carte bancaire (Stripe).
Tarif entreprise : 585€ HT
Questions fréquentes
Quelle est la différence entre DevOps et SRE ?
Le SRE est une implémentation concrète des principes DevOps avec un focus marqué sur la fiabilité, la mesure quantitative (SLO, error budgets) et l'ingénierie logicielle appliquée aux opérations. Cette certification valide spécifiquement les pratiques SRE telles que définies par Google et adoptées par l'industrie européenne.
Faut-il maîtriser un cloud provider spécifique ?
Non. L'examen couvre les concepts SRE cloud-agnostic applicables sur AWS, Azure, GCP ou clouds souverains européens (OVHcloud, Scaleway). Les cas pratiques utilisent des outils open-source et des patterns portables entre providers.
Quels outils sont évalués à l'examen ?
Prometheus, Grafana, Terraform, Ansible, Kubernetes, ArgoCD, ELK/EFK, Jaeger, OpenTelemetry, chaos engineering tools. L'accent est mis sur la compréhension des principes plutôt que la mémorisation de syntaxe spécifique.
Cette certification remplace-t-elle les certifications cloud natives ?
Non, elle les complète. PROVA Cloud SRE se concentre sur les pratiques opérationnelles et la fiabilité multi-cloud, là où les certifications AWS/Azure/GCP certifient la connaissance d'une plateforme spécifique. Elle est particulièrement valorisée en Europe pour sa neutralité technologique.
Comment se préparer efficacement ?
Le parcours LMS inclut labs pratiques sur environnements cloud réels, études de cas d'incidents, exercices de calcul de SLO et simulations de chaos engineering. Comptez 3 à 5 semaines de préparation avec 8-10h hebdomadaires pour une expérience opérationnelle existante.
Ils se sont certifiés
« Enfin une certification SRE qui évalue la vraie compréhension des pratiques et pas juste la mémorisation de commandes. Les cas pratiques sur incident management et chaos engineering reflètent parfaitement mon quotidien. Le rapport DNA m'a aidé à identifier mes axes d'amélioration en observabilité. »
« J'ai passé plusieurs certifications cloud provider-specific, mais PROVA SRE m'a forcée à vraiment comprendre les principes sous-jacents. La neutralité technologique est un vrai plus pour travailler en environnement multi-cloud. Reconnue immédiatement par mon employeur. »
« La préparation via le LMS est excellente, avec des labs pratiques sur Prometheus, Terraform et ArgoCD. L'examen est exigeant mais juste. Cette certification a validé ma transition de sysadmin classique vers SRE et m'a ouvert des opportunités sur des postes à responsabilité. »
Reconnaissance internationale
Couvre les pratiques SRE similaires aux programmes de certification interne de grandes entreprises tech américaines, avec un focus sur les outils open-source et la neutralité cloud.
Votre parcours de certification
Avant, pendant, après — la progression logique recommandée
Droits du candidat
Transparence
Les critères de décision et le barème sont documentés et accessibles avant l'examen.
Droit d'appel
Toute décision peut être contestée dans les 30 jours. Examen par un tiers indépendant.
Plainte
Toute personne peut signaler un dysfonctionnement. Formulaire public accessible sans compte.
