Cloud Site Reliability Engineering
Certification européenne validant la maîtrise des pratiques SRE pour garantir fiabilité, disponibilité et performance des systèmes cloud en production.
Key skills
- ✓Conception et implémentation de SLI/SLO/SLA
- ✓Automatisation des opérations et toil reduction
- ✓Observabilité avancée et incident management
- ✓Chaos engineering et disaster recovery
Market equivalents
This PROVA certification covers the competency scope expected by the following certifications:
Is this right for you?
✓ This certification is right for you if:
- →Ingénieurs SRE confirmés souhaitant valider leurs compétences
- →DevOps Engineers évoluant vers des responsabilités de fiabilité
- →Architectes cloud responsables de la disponibilité des services
✗ This certification is not suitable if:
- →Débutants en administration systèmes sans expérience cloud → orienter vers PROVA Cloud Foundations
- →Architectes cloud seniors cherchant validation stratégique → orienter vers PROVA Cloud Architecture Master 801
Prerequisites & eligibility
Inscription en ligne, paiement par CB ou virement, vérification d'identité lors du proctoring.
Purchase options
Exam voucher, LMS pathway, bundle packs — build your order
Options d'achat
Composez votre parcours — voucher d'examen, préparation LMS, packs entreprise.
Skills assessed
SLI/SLO/SLA
Définir et monitorer les indicateurs de fiabilité alignés avec les objectifs business.
Automatisation
Réduire le toil opérationnel par l'Infrastructure as Code et le self-healing.
Observabilité
Implémenter logging, metrics, tracing distribué et alerting intelligent.
Résilience
Conduire chaos engineering et orchestrer les incidents critiques en production.
Exam format
Curriculum
Fondamentaux SRE et service level management
Philosophie et origines du SRE, différences avec DevOps traditionnel, concept d'error budget et arbitrage vélocité/stabilité, définition et calcul de SLI (Service Level Indicators), conception de SLO (Service Level Objectives) alignés business, rédaction de SLA (Service Level Agreements), identification et mesure du toil, culture blameless et psychological safety, organisation des astreintes et on-call rotations, classification de sévérité d'incidents, communication de crise.
Observabilité et monitoring distribué
Différence monitoring vs observabilité, les trois piliers (logs, metrics, traces), architecture Prometheus et PromQL avancé, visualisation Grafana et dashboard design, stack ELK/EFK pour log management, distributed tracing avec Jaeger et Tempo, instrumentation OpenTelemetry, golden signals (latency, traffic, errors, saturation), stratégies d'alerting et réduction du bruit, corrélation multi-sources, observability-driven development.
Automatisation et Infrastructure as Code
Principes Infrastructure as Code, Terraform pour multi-cloud provisioning, state management et remote backends, Ansible pour configuration management, GitOps avec ArgoCD et FluxCD, pipelines CI/CD pour infrastructure, testing d'infrastructure (Terratest, InSpec), policy as code avec Open Policy Agent, self-healing patterns, automated remediation, runbook automation, secrets management (Vault, SOPS).
Résilience et gestion d'incidents
Principes de chaos engineering, Chaos Monkey et Simian Army, Litmus Chaos pour Kubernetes, game days et exercices de résilience, disaster recovery planning, calcul et optimisation RTO/RPO, backup strategies multi-région, incident response framework, war rooms virtuelles, post-mortem structure et facilitation, action items tracking, capacity planning et forecasting, performance testing (load, stress, soak).
How to fund your certification
3 options to cover the cost of your certification
OPCO — Employer funding
Ask your employer to cover the cost through your OPCO (employee training plan).
Personal — €450 incl. VAT
Secure online payment by credit card (Stripe).
Business rate: €585 excl. VAT
Frequently asked questions
Quelle est la différence entre DevOps et SRE ?
Le SRE est une implémentation concrète des principes DevOps avec un focus marqué sur la fiabilité, la mesure quantitative (SLO, error budgets) et l'ingénierie logicielle appliquée aux opérations. Cette certification valide spécifiquement les pratiques SRE telles que définies par Google et adoptées par l'industrie européenne.
Faut-il maîtriser un cloud provider spécifique ?
Non. L'examen couvre les concepts SRE cloud-agnostic applicables sur AWS, Azure, GCP ou clouds souverains européens (OVHcloud, Scaleway). Les cas pratiques utilisent des outils open-source et des patterns portables entre providers.
Quels outils sont évalués à l'examen ?
Prometheus, Grafana, Terraform, Ansible, Kubernetes, ArgoCD, ELK/EFK, Jaeger, OpenTelemetry, chaos engineering tools. L'accent est mis sur la compréhension des principes plutôt que la mémorisation de syntaxe spécifique.
Cette certification remplace-t-elle les certifications cloud natives ?
Non, elle les complète. PROVA Cloud SRE se concentre sur les pratiques opérationnelles et la fiabilité multi-cloud, là où les certifications AWS/Azure/GCP certifient la connaissance d'une plateforme spécifique. Elle est particulièrement valorisée en Europe pour sa neutralité technologique.
Comment se préparer efficacement ?
Le parcours LMS inclut labs pratiques sur environnements cloud réels, études de cas d'incidents, exercices de calcul de SLO et simulations de chaos engineering. Comptez 3 à 5 semaines de préparation avec 8-10h hebdomadaires pour une expérience opérationnelle existante.
They got certified
« Enfin une certification SRE qui évalue la vraie compréhension des pratiques et pas juste la mémorisation de commandes. Les cas pratiques sur incident management et chaos engineering reflètent parfaitement mon quotidien. Le rapport DNA m'a aidé à identifier mes axes d'amélioration en observabilité. »
« J'ai passé plusieurs certifications cloud provider-specific, mais PROVA SRE m'a forcée à vraiment comprendre les principes sous-jacents. La neutralité technologique est un vrai plus pour travailler en environnement multi-cloud. Reconnue immédiatement par mon employeur. »
« La préparation via le LMS est excellente, avec des labs pratiques sur Prometheus, Terraform et ArgoCD. L'examen est exigeant mais juste. Cette certification a validé ma transition de sysadmin classique vers SRE et m'a ouvert des opportunités sur des postes à responsabilité. »
International recognition
Couvre les pratiques SRE similaires aux programmes de certification interne de grandes entreprises tech américaines, avec un focus sur les outils open-source et la neutralité cloud.
Your certification pathway
Before, during, after — the recommended progression
Droits du candidat
Transparence
Les critères de décision et le barème sont documentés et accessibles avant l'examen.
Droit d'appel
Toute décision peut être contestée dans les 30 jours. Examen par un tiers indépendant.
Plainte
Toute personne peut signaler un dysfonctionnement. Formulaire public accessible sans compte.
