tadata
Retour à l'accueil

Architecture de Reprise après Sinistre : niveaux, compromis et tests

#architecture#disaster-recovery#reliability#cloud#business-continuity

La reprise après sinistre (DR) n'est pas une fonctionnalité à ajouter plus tard. C'est une décision architecturale qui détermine le coût d'infrastructure, la complexité opérationnelle et la tolérance au risque dès le premier jour.

Comparaison des niveaux DR

NiveauStratégieRPORTOCoût relatifRisque de perte
Niveau 0Aucun plan DRIndéfiniJours-Jamais1x (base)Perte totale possible
Niveau 1Sauvegarde & RestaurationHeures-JoursHeures-Jours1.1xDernière fenêtre de backup
Niveau 2Pilot LightMinutes-HeuresHeures1.3xMinimal
Niveau 3Warm StandbyMinutes15-60 min1.5-2xTrès faible
Niveau 4Hot StandbySecondesMinutes2-3xQuasi nul
Niveau 5Actif-ActifQuasi nulQuasi nul3-4xEffectivement nul

RPO = Objectif de Point de Reprise (combien de données pouvez-vous perdre) RTO = Objectif de Temps de Reprise (en combien de temps devez-vous être de retour)

Checklist de test DR

Type de testFréquencePortéePerturbationConfiance
Exercice sur tableTrimestrielParcours des runbooksAucuneFaible-Moyenne
Basculement composantMensuelUn service/BDDMinimaleMoyenne
Basculement régionalSemestrielBascule complète de régionModéréeHaute
Chaos engineeringContinuInjection de pannes aléatoiresVariableHaute
Exercice DR completAnnuelSimulation de panne totaleSignificativeTrès haute
Test restauration backupMensuelRestaurer un backup pour vérifierAucuneMoyenne

Matrice coût vs récupération

Coût ▲
  4x │                                    ● Actif-Actif
     │
  3x │                          ● Hot Standby
     │
  2x │                ● Warm Standby
     │
1.5x │        ● Pilot Light
     │
  1x │ ● Sauvegarde/Restauration
     │
     └────────────────────────────────────────────► Vitesse de récupération
       Jours     Heures     30min    Minutes   Secondes

Décisions par criticité métier

Type de systèmeNiveau recommandéJustification
Outils internesNiveau 1-2Indisponibilité tolérable, sensible au coût
SaaS B2B (standard)Niveau 3SLA typiquement 99.9%, RPO horaire acceptable
SaaS B2B (enterprise)Niveau 4SLA 99.95%+, RPO en minutes
E-commerceNiveau 4Perte de revenu par minute quantifiable
Services financiersNiveau 5Exigences réglementaires, zéro perte
Santé (critique)Niveau 5Sécurité patient, mandats de conformité

Point clé

L'échec DR le plus courant n'est pas technique -- c'est que le plan n'a jamais été testé. Un plan DR qui n'a pas été exercé depuis 6 mois est une hypothèse, pas un plan.

Ressources

Nous utilisons des cookies analytiques pour améliorer votre expérience. Aucune donnée personnelle n'est collectée.