Pourquoi vous ne pouvez pas passer à côté d’un plan de reprise après sinistre (DRP)

La présence constante de menaces telles que les cyberattaques, les catastrophes naturelles ou les pannes matérielles oblige les organisations à mettre en place un plan de reprise après sinistre (DRP) solide. Cet article se penchera sur ce qu'est un DRP et pourquoi il est essentiel pour l'informatique d'une entreprise B2B. Comment s'y prendre ?

Qu'est-ce qu'un plan de reprise après sinistre (DRP) ?

Un DRP (Plan de reprise après sinistre ou désastre) est un ensemble de procédures et de politiques établies par une organisation pour minimiser les perturbations et les dommages causés par des incidents imprévus. Il vise à restaurer les opérations normales le plus rapidement possible après un événement perturbateur. Le DRP s'applique spécifiquement à l'infrastructure informatique d'une entreprise. Son but : protéger les données, les systèmes et les applications critiques.

Le DRP est avant tout - c'est ce que nous considérons chez Win - un travail collectif impliquant des personnes intérieures et extérieures à l'entreprise.

Pourquoi se préparer à un désastre ?

Quelques chiffres inquiétants : 60% des administrations n'ont pas de plan de continuité en cas d'incident majeur pour les ressources critiques, selon Digital Wallonia (2022). 24% ont une assurance garantissant une assistance financière et/ou technique en cas de sinistre.

Selon Gartner, 40% des entreprises qui subissent une perte de données sont susceptibles de disparaître dans les 5 ans. Pire encore : Gartner donne 13 mois maximum aux organisations qui subissent un incident majeur et n'ont pas de plan de continuité.

Les causes de pertes de données sont nombreuses (dégâts de la nature, incendie, erreur humaine, pannes liées au matériel, tentatives de piratage, etc), et leur impact présente plusieurs niveaux de gravité pouvant mener jusqu’à une interruption définitive des activités.

C’est pourquoi il est nécessaire d’avoir recours à un DRP pensé pour vous et conçu selon vos enjeux spécifiques.

Créer son plan de reprise : l’approche NIST

L'approche NIST est une des méthodes qui permet de créer et de planifier un plan de reprise après désastre.

Le NIST (National Institute of Standards and Technology) publie, depuis 1988, des normes, directives et bonnes pratiques pour gérer la cybersécurité des organisations. Cette entité appartient au Ministère de l'économie américain. Le NIST a défini un Cybersecurity Framework (CSF) pour aider les organisations à mieux contrôler leur sécurité.

Identifier : Il s’agit dans un premier temps de comprendre comment fonctionne son organisation, d’identifier les départements critiques et de se pencher sur les systèmes qui les supportent. Objectif : cartographier les risques et menaces associés aux ressources critiques de votre organisation.

Protéger : c’est la mise en place des moyens de protection permettant de minimiser les risques (ex : backup, redondance, etc)

Détecter : il s’agit de détecter les incidents de sécurité potentiels ou réels grâce à la mise en place de politiques de sécurité et d’outils de défense tels que le SIEM, le CSOC, l’EDR, etc.

Répondre : lorsqu’un incident de sécurité est détecté, il s’agit de prendre immédiatement les mesures pour contenir l’incident, évaluer l’impact et définir la réponse.

Récupérer : cette étape vise à restaurer les opérations normales de l’organisation.

Définir ses objectifs de reprise

Après avoir identifié les risques potentiels (incendies, inondations, cyber-attaques, etc) et analysé les impacts potentiels (pertes financières, réputation, perte de données, etc), les objectifs de reprise pour chaque service critique sont définis. Un DRP bien conçu permet de minimiser les temps d'arrêt en prévoyant des mesures de prévention, de détection et de réaction rapides.

Deux approches doivent être définies, RPO et RTO.

Le RP0 (Recovery Point Objective) est le temps associé à une perte de données acceptable. Exemple : votre back-up est réalisé toutes les 24h, vous perdez donc potentiellement 24h de données. Le RTO (Recovery Time Objective) est le temps maximum accepté entre l'incident et la restauration de ce que l'on pourrait appeler le minimum vital de continuité des opérations.

Traduction : Combien de temps mes services peuvent rester inopérants et quelle quantité de données peut être perdue ?

Pour répondre à cette question cruciale, il faut considérer plusieurs niveaux et peser le rapport coût/disponibilité.

Quelles stratégies de reprise ?

Plusieurs moyens de protection et de sauvegarde sont envisageables, en fonction des objectifs fixés. Le DRP doit inclure les stratégies spécifiques à mettre en œuvre pour une reprise rapide des opérations. Il s’agit par exemple de sauvegarder ses données critiques, de disposer de sites de secours et de ressources humaines, etc.

Mais quelles mesures choisir ? Pour ce faire il faut évaluer la pertinence de chacune en comparant son coût à celui d’une perte potentielle d’activité et son impact sur son organisation.

En ce qui concerne les sauvegardes (Backup), quelques règles sont préconisées de manière chiffrée :

3 copies différentes des données
2 supports différents
1 copie externe
1 des copies déconnectée ou immuable
0 erreur lors de test de sauvegarde et de restauration

En cas de sinistre, trois mesures sont à prendre de manière ordonnée : d’abord, identifier les workloads critiques. Ensuite, rallumer ces flux près des back-up en mode DRP. Enfin, rapatrier les flux à l’aise vers leur emplacement d’origine.

Les bonnes pratiques

La définition d'un DRP se base sur une affirmation assez simple : il faut espérer le meilleur, mais se tenir prêt pour le pire en cas de catastrophe. Un DRP définit en effet des procédures qu’on espère ne jamais devoir mettre en place pour la restauration des systèmes et des applications.

Concrètement il prend la forme d’un document abordant les points incontournables à prendre en compte en cas de reprise après incident :

Les objectifs : quelles sont les fonctions critiques à rétablir et dans quel timing ?

Les scénarios : redémarrage en mode DRP (minimum de groupes à remettre en route et en service) ou en mode « full » pour une restauration la plus complète possible ?

Les rôles et responsabilités : quels sont les rôles de chaque membre de l’équipe qui prend part au DRP ?

L'inventaire des ressources (infrastructures, réseaux, matériel, fournisseurs de services, etc) nécessaires à la reprise d’activité.

La méthodologie : l’impact IT, la migration des adresses IP, disposer des capacités nécessaires en termes de stockage et de machines virtuelles, par exemple.

Les procédures : le détail et les étapes de la marche à suivre pour reprendre l’activité et ce tant au niveau opérationnel, qu’en matière de communication interne et externe.

Une fois établi, le DRP sera testé annuellement pour, par exemple, comparer les résultats (timings) aux attentes définies (RTO/RPO). Une revue régulière sera effectuée de manière à se baser sur un plan cohérent avec la réalité de son organisation (évolution de l’organisation, des technologies, des risques).

DRP : les solutions à votre disposition

Un plan de reprise après sinistre ne s’improvise pas, nous l’avons vu. Une batterie de solutions est à votre disposition pour alimenter votre stratégie de reprise :

Back-up : Win travaille avec des solutions VEEAM reconnues mondialement pour assurer la résilience des données grâce à des solutions de sauvegarde sécurisée et de restauration rapide et fiable, quel que soit l’environnement.
Sécurité et Réseau : un réseau parfaitement sécurisé est un rempart contre les intrusions. Une solution de connectivité redondante peut intervenir en cas de coupure d’une liaison principale.
SOC : le CyberSOC assure une surveillance continue de votre système d’information. Il s’agit d’une équipe d’experts dédiée à la sécurité de votre organisation.
Cloud Agilis avec une approche Cloud Privé ou Hybride sur-mesure en fonction de votre organisation.
Azure by Win : Un Cloud public Azure managé par Win pour vous pour les données non sensibles de l’entreprise (en raison du Cloud Act).
Datacenter en Belgique : le WDC est un centre de données (Datacenter) souverain situé à Villers-le-Bouillet, permet d’héberger vos données sensibles (territorialité des données), où vous disposez d’espace pour vos données, vos serveurs et autres matériels (switch, contrôleur de stockage, etc.), ainsi que d’espaces pour accueillir vos équipes en cas d’incident sur votre site.
Accompagnement et conseils dans l’élaboration d’un DRP.

Conclusion

Un DRP est un plan complet qui vous permet de gérer efficacement des situations de crise et de rétablir efficacement et sereinement vos activités critiques en cas de perturbation majeure.

Ce travail de planification est essentiel et doit provenir d’un travail conjoint entre les équipes IT et l’ensemble des départements de votre organisation.

Vos données sont critiques pour la continuité de vos opérations ? Parlons DRP ensemble et voyons quel plan de reprise après sinistre convient à vos besoins propres.

Win