tadata
Retour à l'accueil

Patterns d'Architecture de Données : Lambda, Kappa, Medallion, Mesh & Fabric

#data-architecture#architecture#data-engineering#strategy

Le choix d'un pattern d'architecture de données impacte tout en aval : structure d'équipe, outillage, coût et vitesse à laquelle les insights atteignent les décideurs. Chaque pattern a émergé de contraintes spécifiques. Comprendre ces contraintes évite d'adopter le mauvais pattern par mimétisme.

Comparaison des patterns

DimensionLambdaKappaMedallionData MeshData Fabric
Idée centraleCouches batch + streamStream uniquementCouches Bronze/Silver/GoldPropriété par domaineIntégration par métadonnées
ComplexitéHaute (double pipeline)MoyenneMoyenneHaute (organisationnelle)Haute (couche métadonnées)
LatenceBatch: heures, Stream: secondesSecondesDépend de la coucheVarie par domaineVariable
Modèle d'équipeÉquipe data centraliséeÉquipe data centraliséeCentralisé ou plateformeÉquipes domaine fédéréesCentralisé + fédéré
Idéal pourBesoins mixtes batch/temps réelStreaming purLakehouse / analytiqueGrandes orgs, nombreux domainesEntreprises multi-sources
Risque cléDuplication de code, dériveRetraitement à l'échelleGoulot couche GoldFragmentation gouvernanceComplexité métadonnées

Arbre de décision

Début
  │
  ├─ Besoin de traitement temps réel ET batch ?
  │   ├─ Oui → Unifiable en un seul flux ?
  │   │         ├─ Oui → KAPPA
  │   │         └─ Non → LAMBDA
  │   └─ Non → Principalement analytique/BI ?
  │             ├─ Oui → MEDALLION (Lakehouse)
  │             └─ Non → Plusieurs domaines autonomes ?
  │                       ├─ Oui → DATA MESH
  │                       └─ Non → Nombreuses sources hétérogènes ?
  │                                 ├─ Oui → DATA FABRIC
  │                                 └─ Non → Commencer simple (warehouse + ELT)

Matrice d'adéquation organisationnelle

FacteurLambdaKappaMedallionData MeshData Fabric
Taille orgMoyenne-GrandeTouteTouteGrande (50+ ingénieurs)Entreprise
Maturité équipe dataHauteMoyenneFaible-MoyenneHauteHaute
Nombre de domainesPeuPeuPeu-BeaucoupNombreux (4+)Nombreux
Besoins réglementairesMoyenMoyenHaut (lignage)Haut (contrats)Haut (catalogue)
Stratégie cloudTouteStreaming-heavyVendeur lakehouseMulti-plateformeMulti-cloud

Conseils pratiques

Commencez par Medallion si vous construisez une nouvelle plateforme analytique. Le layering Bronze/Silver/Gold est intuitif et bien outillé (Delta Lake, Apache Iceberg).

Adoptez les principes Data Mesh graduellement. Commencez par un catalogue de données et la propriété de datasets clés par domaine. Ne réorganisez pas les équipes avant d'avoir validé le modèle de gouvernance avec 2-3 domaines.

Lambda est legacy dans la plupart des cas. Si vous opérez Lambda aujourd'hui, évaluez si Kappa ou Medallion peut remplacer la complexité du double pipeline.

Ressources

Nous utilisons des cookies analytiques pour améliorer votre expérience. Aucune donnée personnelle n'est collectée.