Data Architecture Expert
Maîtrisez la conception d'architectures data modernes, du data lake au data mesh, et pilotez la stratégie de gouvernance des données en entreprise.
Key skills
- ✓Concevoir des architectures data scalables (batch, streaming, hybride)
- ✓Maîtriser les patterns modernes : data lake, lakehouse, data mesh, data fabric
- ✓Implémenter la gouvernance, qualité et sécurité des données
- ✓Piloter les choix technologiques et les migrations d'architecture
Market equivalents
This PROVA certification covers the competency scope expected by the following certifications:
Is this right for you?
✓ This certification is right for you if:
- →Architectes data souhaitant valider leur expertise sur les patterns modernes
- →Data Engineers seniors évoluant vers des rôles d'architecture
- →Architectes solutions IT spécialisant leur parcours vers la data
✗ This certification is not suitable if:
- →Débutants en data : orientez-vous d'abord vers une certification Data Engineering Foundations ou SQL/Database Fundamentals pour acquérir les bases.
- →Architectes data seniors avec 8+ ans d'expérience : considérez plutôt notre certification Master 801 Data Strategy & Leadership pour piloter la transformation data à l'échelle entreprise.
Prerequisites & eligibility
Aucun prérequis formel, mais 3 ans d'expérience en ingénierie ou architecture data fortement recommandés.
Purchase options
Exam voucher, LMS pathway, bundle packs — build your order
Options d'achat
Composez votre parcours — voucher d'examen, préparation LMS, packs entreprise.
Skills assessed
Architectures modernes
Concevoir des architectures data lake, lakehouse, data mesh et data fabric adaptées aux besoins métier.
Gouvernance des données
Implémenter des stratégies de gouvernance, qualité, sécurité et conformité (RGPD, lineage).
Scalabilité & performance
Optimiser les pipelines batch et streaming pour des volumes massifs et la haute disponibilité.
Choix technologiques
Évaluer et sélectionner les stacks adaptées : cloud, on-premise, open source ou propriétaires.
Exam format
Curriculum
Fondamentaux de l'architecture data
Principes d'architecture d'entreprise appliqués aux données. Modélisation conceptuelle (entité-relation), logique (schémas relationnels, star schema, snowflake) et physique (partitionnement, indexation). Normalisation (3NF, BCNF) vs dénormalisation pour la performance. Différences architecturales entre data warehouse (Kimball, Inmon), data mart, ODS et data lake. Patterns architecturaux : Lambda (batch + streaming), Kappa (streaming-first), Medallion (Bronze/Silver/Gold). Principes de séparation compute/storage. Architecture orientée événements (EDA).
Architectures modernes et distribuées
Data lake : architecture HDFS, S3, ADLS, zones (raw, curated, trusted). Data lakehouse : Delta Lake, Apache Iceberg, Apache Hudi (ACID, time travel, schema evolution). Data mesh : domain-oriented ownership, data as a product, self-serve platform, federated governance. Data fabric : unified data management, active metadata, knowledge graph. Architectures multi-cloud et hybrides : stratégies de réplication, data residency, vendor lock-in. Streaming architecture : Apache Kafka (topics, partitions, consumer groups), Apache Pulsar, AWS Kinesis, Azure Event Hubs. Change Data Capture (CDC) avec Debezium, Airbyte. Real-time analytics avec Apache Flink, ksqlDB.
Gouvernance, qualité et sécurité
Frameworks de gouvernance : DAMA-DMBOK, DCAM. Data catalog et metadata management : Collibra, Alation, Azure Purview, AWS Glue Catalog, OpenMetadata. Data lineage : traçabilité end-to-end, impact analysis. Qualité des données : dimensions (exactitude, complétude, cohérence, fraîcheur), outils (Great Expectations, Deequ, Soda). Master Data Management (MDM) : golden records, matching, merging. Conformité RGPD : privacy by design, droit à l'oubli, portabilité, pseudonymisation. Sécurité : chiffrement au repos (AES-256, KMS) et en transit (TLS), data masking, tokenization, RBAC/ABAC, data loss prevention (DLP). Audit et logging.
Technologies et stacks data
Bases relationnelles : PostgreSQL, MySQL, Oracle Database, SQL Server, architectures HA (réplication, failover). NoSQL : MongoDB (document), Cassandra (wide-column), DynamoDB, Redis (key-value), Neo4j (graph). Data warehouses cloud : Snowflake (architecture multi-cluster), Google BigQuery (columnar storage, BI Engine), Amazon Redshift (Spectrum, RA3 nodes), Azure Synapse Analytics. Moteurs de traitement distribué : Apache Spark (RDD, DataFrame, Catalyst optimizer), Apache Flink (stateful streaming), Databricks (Delta Engine, Photon). Orchestration : Apache Airflow (DAGs), Prefect, Dagster, AWS Step Functions. Formats de fichiers : Parquet, ORC, Avro, JSON, CSV. Compression : Snappy, Gzip, LZ4.
How to fund your certification
3 options to cover the cost of your certification
OPCO — Employer funding
Ask your employer to cover the cost through your OPCO (employee training plan).
Personal — €450 incl. VAT
Secure online payment by credit card (Stripe).
Business rate: €585 excl. VAT
Frequently asked questions
Quelle différence avec les certifications cloud (AWS, Azure, GCP) ?
PROVA Data Architecture Expert est agnostique des fournisseurs cloud et couvre l'ensemble des patterns modernes (data mesh, lakehouse, data fabric) avec une approche architecturale stratégique, pas uniquement opérationnelle sur un cloud spécifique.
Faut-il connaître tous les outils mentionnés dans le référentiel ?
Non. L'examen évalue votre capacité à choisir et comparer des technologies selon des critères architecturaux (scalabilité, coût, gouvernance), pas la maîtrise exhaustive de chaque outil. Une connaissance pratique de 2-3 stacks est suffisante.
Cette certification couvre-t-elle le machine learning et l'IA ?
Partiellement : elle aborde l'architecture des pipelines de données pour la ML (feature stores, MLOps), mais pas la modélisation ou l'entraînement. Pour cela, consultez nos certifications spécialisées IA.
Puis-je passer l'examen en anglais ?
Oui, l'examen est disponible en français et en anglais. Vous choisissez la langue au moment de la réservation.
Comment se préparer efficacement ?
Le parcours LMS PROVA inclut des études de cas réels, des architectures de référence, des quiz et des labs pratiques. Comptez 2 à 4 semaines de préparation intensive selon votre expérience.
They got certified
« Excellente certification qui couvre enfin les architectures modernes comme le data mesh et le lakehouse. Les cas pratiques sont réalistes et m'ont permis de valider mes choix d'architecture auprès de ma direction. »
« J'ai apprécié l'approche agnostique des clouds et l'accent mis sur la gouvernance. Le rapport PROVA DNA m'a aidée à identifier mes axes de progression, notamment sur le data fabric. »
« Enfin une alternative européenne crédible aux certifications US ! Le contenu est dense, technique et à jour. La préparation via le LMS est excellente avec des labs pratiques pertinents. »
International recognition
Couvre les mêmes domaines que les certifications AWS Certified Data Analytics, Google Cloud Professional Data Engineer, et Databricks Certified Data Engineer, avec une approche agnostique des fournisseurs.
AWS, Google Cloud, et Databricks sont des marques déposées de leurs propriétaires respectifs. PROVA est indépendant et non affilié à ces organisations.
Your certification pathway
Before, during, after — the recommended progression
Droits du candidat
Transparence
Les critères de décision et le barème sont documentés et accessibles avant l'examen.
Droit d'appel
Toute décision peut être contestée dans les 30 jours. Examen par un tiers indépendant.
Plainte
Toute personne peut signaler un dysfonctionnement. Formulaire public accessible sans compte.
