Site Reliability Engineering
Certifiez votre maîtrise de la fiabilité des systèmes distribués : observabilité, SLO/SLA, incident management, automatisation et culture DevOps.
Compétences clés
- ✓Définir et monitorer SLI, SLO et error budgets
- ✓Implémenter observabilité avancée (métriques, logs, traces)
- ✓Gérer incidents et post-mortems sans reproche
- ✓Automatiser toil et opérations avec IaC
Équivalences de marché
Cette certification PROVA couvre le périmètre de compétences attendu par les certifications suivantes :
Est-ce fait pour vous ?
✓ Cette certification est faite pour vous si :
- →Ingénieurs systèmes et infrastructure
- →DevOps engineers
- →Administrateurs production
✗ Cette certification n'est pas adaptée si :
- →Débutants sans expérience opérationnelle : orientez-vous d'abord vers une certification Linux ou DevOps Foundations.
- →SRE seniors cherchant validation de leadership : considérez plutôt notre Master 801 Engineering Management.
Prérequis & conditions d'accès
Inscription en ligne, paiement sécurisé, vérification d'identité avant examen.
Options d'achat
Voucher d'examen, parcours LMS, packs économiques — composez votre panier
Options d'achat
Composez votre parcours — voucher d'examen, préparation LMS, packs entreprise.
Compétences évaluées
Fiabilité mesurable
Définissez SLI/SLO pertinents et pilotez la fiabilité par les error budgets, pas par l'intuition.
Observabilité complète
Maîtrisez Prometheus, Grafana, OpenTelemetry et ELK pour diagnostiquer rapidement les incidents complexes.
Automatisation systématique
Éliminez le toil répétitif avec Terraform, Ansible, CI/CD et scripting avancé.
Culture blameless
Conduisez post-mortems constructifs et améliorez continuellement la résilience organisationnelle.
Format de l'examen
Programme
Principes et culture SRE
Origines du SRE chez Google, différence avec DevOps traditionnel, concept d'error budget comme outil de négociation, culture blameless et apprentissage par l'échec, équilibre 50/50 ops/engineering, élimination systématique du toil, mesure et réduction du travail manuel répétitif.
Service Level Objectives et métriques
Distinction SLI/SLO/SLA, choix d'indicateurs pertinents (latence, disponibilité, throughput), calcul d'error budgets et prise de décision basée sur les budgets, alerting intelligent basé sur les SLO (burn rate), éviter l'alert fatigue, multi-window multi-burn-rate alerts, documentation des SLO pour les parties prenantes.
Observabilité et monitoring
Les trois piliers : métriques, logs, traces. Prometheus : architecture, PromQL, exporters, federation. Grafana : dashboards opérationnels, alerting, visualisations avancées. OpenTelemetry : instrumentation automatique et manuelle, propagation de contexte. Logs structurés avec ELK ou Loki. Distributed tracing avec Jaeger/Tempo. Corrélation métriques-logs-traces pour diagnostic rapide.
Incident management et post-mortems
Processus d'incident : détection, triage, mitigation, résolution, communication. Rôles (incident commander, scribe, liaison). Escalade et mobilisation des équipes. Post-mortem blameless : structure, timeline, root cause analysis (5 whys, fishbone), action items mesurables. Runbooks et playbooks opérationnels. Gestion du stress et fatigue en incident.
Automatisation et Infrastructure as Code
Terraform : provisioning déclaratif, modules, state management, workspaces. Ansible : configuration management, playbooks, rôles, idempotence. GitOps : ArgoCD, FluxCD, infrastructure versionnée. CI/CD pour infrastructure : testing, validation, rollback. Scripting Python/Go pour automatisation custom. Mesure du toil et ROI de l'automatisation.
Comment financer votre certification
3 solutions pour couvrir le coût de votre certification
OPCO — Prise en charge employeur
Demandez à votre employeur une prise en charge via votre OPCO (plan de développement des compétences).
Personnel — 450€ TTC
Paiement en ligne sécurisé par carte bancaire (Stripe).
Tarif entreprise : 585€ HT
Questions fréquentes
Quelle différence avec une certification DevOps classique ?
Le SRE se concentre spécifiquement sur la fiabilité en production : SLO, observabilité avancée, incident management structuré et élimination du toil. Le DevOps couvre un spectre plus large incluant culture, CI/CD et collaboration.
Faut-il connaître Kubernetes pour passer cette certification ?
Kubernetes est fortement recommandé mais pas strictement obligatoire. L'examen couvre des concepts génériques applicables à tout système distribué, mais les cas pratiques peuvent inclure des environnements conteneurisés.
Les outils Google (Stackdriver, etc.) sont-ils au programme ?
Non. PROVA privilégie les outils open source et cloud-agnostic : Prometheus, Grafana, OpenTelemetry, Terraform. Les principes SRE de Google sont enseignés, pas leurs outils propriétaires.
Cette certification remplace-t-elle l'expérience terrain ?
Non. Elle valide que vous maîtrisez les concepts, outils et méthodologies SRE modernes. L'expérience opérationnelle reste indispensable pour devenir SRE senior. Considérez-la comme un accélérateur de carrière, pas un substitut.
Pourquoi choisir PROVA plutôt qu'une certification US ?
PROVA est alignée sur les standards européens (EQF/ESCO), moins coûteuse, et évalue des compétences opérationnelles concrètes plutôt que la mémorisation de documentation vendor-specific. Votre certificat est vérifiable publiquement sans dépendre d'une plateforme américaine.
Ils se sont certifiés
« Enfin une certification qui évalue la vraie pratique SRE, pas juste la théorie Google. Les cas d'incident sont réalistes et m'ont fait progresser même pendant l'examen. »
« J'ai passé plusieurs certifications cloud US. PROVA SRE est plus pragmatique, moins marketing, et le rapport DNA m'a aidée à identifier mes axes d'amélioration précis en observabilité. »
« La préparation m'a forcé à structurer mes connaissances empiriques. Mon employeur a valorisé la certification EQF 6 pour ma promotion interne. Excellent ROI. »
Reconnaissance internationale
Couvre les domaines du Google Professional Cloud DevOps Engineer et du Linux Foundation Certified SRE, avec focus sur outils open source.
Google Cloud et Linux Foundation sont des marques déposées de leurs propriétaires respectifs. PROVA est indépendant et non affilié.
Votre parcours de certification
Avant, pendant, après — la progression logique recommandée
Droits du candidat
Transparence
Les critères de décision et le barème sont documentés et accessibles avant l'examen.
Droit d'appel
Toute décision peut être contestée dans les 30 jours. Examen par un tiers indépendant.
Plainte
Toute personne peut signaler un dysfonctionnement. Formulaire public accessible sans compte.
