tadata
Retour à l'accueil

Politiques de Rétention des Données : Équilibrer Conformité, Coût et Utilité

#data-governance#compliance#finops#data-strategy

La plupart des organisations stockent leurs données indéfiniment par défaut. Cela crée des coûts croissants, un risque de conformité accru et une complexité de gouvernance. Une politique de rétention bien conçue définit combien de temps les données sont conservées, quand elles transitent entre les niveaux de stockage, et quand elles sont définitivement supprimées.

Exigences Réglementaires de Rétention

RéglementationType de donnéesRétention minimaleRétention maximaleNotes
RGPD (UE)Données personnellesNon spécifiéeAussi courte que nécessairePrincipe de minimisation
SOX (US)Documents financiers7 ansPas de maximumPiste d'audit pour sociétés cotées
HIPAA (US)Dossiers médicaux6 ansPas de maximumA partir de la création
PCI-DSSDonnées de carteSelon besoin métierMinimiser le stockageNe pas stocker les données d'authentification
Fiscalité (variés)Documents fiscaux3-10 ans selon paysPas de maximumFrance : 6 ans, Allemagne : 10 ans
Droit du travailDossiers employés1-7 ans après départPas de maximumVarie selon la juridiction

Diagramme du Cycle de Vie des Données

┌─────────┐    ┌──────────┐    ┌───────────┐    ┌──────────┐    ┌──────────┐
│ Création│───▶│ Stockage │───▶│ Archive   │───▶│ Archive  │───▶│Suppression│
│         │    │  Actif   │    │  Tiède    │    │  Froide  │    │  / Purge │
└─────────┘    └──────────┘    └───────────┘    └──────────┘    └──────────┘

Chronologie: Jour 0      3-6 mois        1-3 ans         3-7 ans       Fin de vie
Coût/Go:     $$$         $$              $               centimes       0 $
Accès:       Millisecondes  Secondes     Minutes-Heures  N/A           N/A

Matrice d'Impact sur les Coûts : Conserver vs Archiver vs Supprimer

VolumeStockage chaudArchive tièdeArchive froideSupprimerÉconomie annuelle
1 To276 $/an150 $/an48 $/an0 $/an276 $
10 To2 760 $/an1 500 $/an480 $/an0 $/an2 760 $
100 To27 600 $/an15 000 $/an4 800 $/an0 $/an27 600 $
1 Po276 000 $/an150 000 $/an48 000 $/an0 $/an276 000 $

Coûts cachés de la sur-rétention :

  • Coûts de calcul pour scanner des datasets plus gros
  • Overhead de gestion du catalogue et des métadonnées
  • Risque de conformité (plus de données = plus de DCP = plus d'exposition)
  • Temps d'ingénierie pour gérer des datasets hypertrophiés

Stratégie de Rétention par Catégorie

CatégorieActifTièdeFroidSuppressionJustification
Données transactionnelles1 an1-3 ans3-7 ansAprès 7 ansConformité SOX / fiscale
Comportement utilisateur3 mois3-12 moisAprès 12 moisUtilité analytique décroît vite
DCP / profils clientsSelon besoinSur demande ou fin d'usageMinimisation RGPD
Données d'entraînement ML6 mois6-24 moisAprès re-entraînementLignage de modèle
Logs / observabilité30 jours30-90 joursAprès 90 joursCoût, faible valeur long terme

Pièges Courants

  • "Tout garder pour toujours" — le défaut qui crée des coûts et risques illimités
  • Pas de revue juridique — périodes de rétention définies par l'ingénierie sans avis compliance
  • Angle mort des sauvegardes — données supprimées du primaire mais persistant dans les backups
  • Pas de différenciation DCP — appliquer la même rétention aux DCP et non-DCP
  • Suppression manuelle — se reposer sur des humains au lieu de politiques de cycle de vie automatisées

Ressources

Nous utilisons des cookies analytiques pour améliorer votre expérience. Aucune donnée personnelle n'est collectée.