Architecture Data Fabric : Accès Unifié aux Données par les Métadonnées Actives
#data-architecture#data-fabric#data-integration#ai
Le data fabric est une approche architecturale qui utilise les métadonnées actives, les graphes de connaissances et l'IA pour automatiser l'intégration et la gouvernance des données dans des environnements distribués. Contrairement au data mesh (organisationnel), le data fabric est une couche technologique.
Data Fabric vs Data Mesh
| Dimension | Data Fabric | Data Mesh |
|---|---|---|
| Nature | Architecture technique | Paradigme organisationnel |
| Idée centrale | Intégration automatisée par métadonnées | Propriété par domaine + plateforme self-service |
| Centralisation | Métadonnées centralisées, données distribuées | Propriété et architecture décentralisées |
| Automatisation | Élevée — découverte pilotée par IA | Faible — repose sur les équipes domaine |
| Gouvernance | Unifiée, pilotée par métadonnées | Fédérée, pilotée par domaines |
| Idéal pour | Paysages legacy complexes | Organisations avec domaines bien définis |
| Complémentaires ? | Oui — le fabric peut servir de couche plateforme au mesh |
Couches Architecturales
┌─────────────────────────────────────────────────────────────┐
│ CONSOMMATEURS DE DONNEES │
│ Analystes │ Data Scientists │ Applications │ IA/ML │
└──────────────────────┬──────────────────────────────────────┘
│
┌──────────────────────▼──────────────────────────────────────┐
│ COUCHE D'ACCÈS UNIFIÉ │
│ Requêtes virtuelles │ APIs │ Couche sémantique │
└──────────────────────┬──────────────────────────────────────┘
│
┌──────────────────────▼──────────────────────────────────────┐
│ MÉTADONNÉES ACTIVES & GRAPHE DE CONNAISSANCES │
│ Inférence schéma │ Lignage │ Règles qualité │ PII │
└──────────────────────┬──────────────────────────────────────┘
│
┌──────────────────────▼──────────────────────────────────────┐
│ INTEGRATION & ORCHESTRATION │
│ ETL/ELT │ CDC │ Streaming │ Virtualisation │
└──────────────────────┬──────────────────────────────────────┘
│
┌──────────────────────▼──────────────────────────────────────┐
│ SOURCES DE DONNEES │
│ SGBDR │ Data Lakes │ APIs SaaS │ Fichiers │ Flux │
└─────────────────────────────────────────────────────────────┘
Taxonomie des Métadonnées Actives
Métadonnées Actives
├── Métadonnées Techniques
│ ├── Schéma & types
│ ├── Graphes de lignage
│ ├── Fraîcheur & obsolescence
│ └── Patterns de requêtes
├── Métadonnées Opérationnelles
│ ├── Historique d'exécution
│ ├── Scores de qualité
│ ├── Conformité SLA
│ └── Coût par dataset
├── Métadonnées Métier
│ ├── Propriété par domaine
│ ├── Glossaire métier
│ ├── Classification sensibilité
│ └── Exigences réglementaires
└── Métadonnées Sociales
├── Fréquence d'usage par équipe
├── Classement popularité
└── Scores de confiance
Modèle de Maturité
| Niveau | Nom | Caractéristiques | Métrique clé |
|---|---|---|---|
| 1 | Cloisonné | Pas de métadonnées unifiées | Temps pour trouver : jours |
| 2 | Catalogue | Catalogue passif, enregistrement manuel | Temps pour trouver : heures |
| 3 | Connecté | Découverte automatisée, lignage | Temps pour trouver : minutes |
| 4 | Intelligent | Recommandations IA, qualité auto | Self-service : >60% |
| 5 | Autonome | Pipelines auto-réparants | Incidents auto-résolus : >80% |
Ressources
- Gartner — Architecture Data Fabric
- Denodo — Virtualisation de Données
- Informatica IDMC
- Atlan — Métadonnées Actives
:::