L’incendie du data center d’OVHcloud a rappelé de façon douloureuse à certaines entreprises qu’il est indispensable de sécuriser ses sauvegardes et de disposer d’un plan de reprise d’activité. Une supervision est à ce titre essentielle pour garantir que tout est sous contrôle.
Survenu dans la nuit du 10 mars dernier, l’incendie du centre de données d’OVHcloud à Strasbourg a mis en lumière certaines facettes des contrats d’hébergement de données dans le cloud. Des entreprises clientes du fleuron de la tech française ont en effet perdu toutes leurs données dans le désastre et se sont aperçues avec effroi qu’elles n’avaient pas souscrit d’option complémentaire de redondance des backups auprès d’OVHcloud ni sécurisé d’autres sauvegardes hébergées ailleurs.
Effectivement, ce n’est pas parce que l’on confie ses données et ses applications à un fournisseur de cloud que cela garantie leur protection de manière automatique. C’est au patron de l’entreprise et à son directeur informatique qu’il incombe de sécuriser les données et de mettre en place un PRA (plan de reprise d’activité), seul garant de rebond rapide lors de ce type d’incident et qui n’est pas inclus d’office dans les offres des hébergeurs cloud.
Un grand data center « public » qui part en fumée est un événement plutôt rare, mais cela arrive, comme on a également pu le constater au Japon il y a quelques années avec l’incendie d’un centre de données d’AWS, leader mondial du cloud. Anticiper ce type de sinistre doit donc être pris au sérieux, notamment grâce à la supervision, outil clé d’une bonne gestion IT de l’entreprise.
Un plan de reprise d’activité pour parer à toute éventualité
Les menaces qui pèsent sur l’intégrité des données de l’entreprise sont nombreuses et ne se limitent pas aux incendies : cyberattaques, sabotages physiques, configurations défectueuses, mises à jour défaillantes, etc. Un PRA est donc primordial pour contrer ces imprévus et leurs conséquences immédiates (arrêt de production, des ventes…) ou plus durables sur chaque service métier.
Ce plan consiste à envisager tous les incidents et scénarios possibles puis à prévoir une parade correspondante, que ce soit en interne ou à l’aide d’un prestataire. Le coeur du PRA réside dans le fait de disposer de plusieurs sauvegardes de l’ensemble de ses données, mais pas seulement.
Le PRA doit inclure la liste des intervenants impliqués à contacter ainsi que les actions à entreprendre en cas d’incident, pour chacun des rôles, que l’on parle des responsables informatiques, patrons, utilisateurs, prestataires, sous-traitants ou de la police… Un scénario précis de remise en route de l’activité doit également être défini, avec notamment l’ordre dans lequel les backups doivent être restaurés ainsi que la vérification de l’intégrité des données récupérées et leur caractère réutilisable.
Il convient également d’anticiper le temps de remise en route des applications et d’accès aux données, cela pouvant être rapide comme prendre plusieurs jours selon le type de contrat de PRA souscrit auprès d’un hébergeur. C’est pourquoi il est important d’identifier clairement les activités critiques de l’entreprise afin de prioriser les actions, définir les besoins humains et matériels ainsi que les coûts afférents. Il est enfin essentiel de procéder régulièrement à des tests de bon fonctionnement de ce PRA, en s’entraînant aux différentes procédures prévues.
Des sauvegardes multiples et supervisées
Comme évoqué, veiller à disposer à tout moment de plusieurs sauvegardes du patrimoine informationnel de l’entreprise est la clé de voûte du PRA. On parle ici d’appliquer la méthode 3-2-1 qui consiste à détenir 3 copies de données, sur au moins 2 supports de stockage différents (cloud, serveurs, bandes…), dont 1 copie que l’on aura pris soin de placer hors-site pour limiter les conséquences d’une panne informatique et si possible non connectée au réseau pour se protéger des cyberattaques. Sachant qu’une copie se trouve bien entendu sur site pour redémarrer l’activité rapidement lors des incidents mineurs.
Les sauvegardes doivent être planifiées de façon régulière et automatisées pour réduire l’impact des disparitions de données, avec des fréquences qui pourront varier en fonction de leur importance et de leur caractère sensible. Ces backups doivent être vérifiés et testés là aussi régulièrement en procédant à des restaurations de données pour s’assurer de leur cohérence.
Reste un aspect important à prendre en compte : s’assurer du bon déroulement des sauvegardes lorsque celles-ci sont censées s’effectuer. La supervision IT a ici son rôle à jouer pour surveiller ces backups et ainsi garantir un PRA effectivement fonctionnel. Plusieurs aspects peuvent être contrôlés, à commencer par le dossier de sauvegarde sur lequel on place un capteur pour vérifier que de nouveaux fichiers ont écrasé les précédents à une certaine heure par exemple.
Une autre option consiste à vérifier de façon automatisée les notifications email envoyées par les solutions de sauvegarde ainsi que la présence de mots-clés dans les messages reçus. Il est également possible de se servir de la supervision pour scanner les journaux d’événements du système d’exploitation afin d’être averti d’un échec de backup. Il existe par ailleurs d’autres capteurs de supervision spécifiques pour surveiller précisément les sauvegardes réussies, échouées, en cours d’exécution ou terminées.
Les possibilités ne manquent donc pas pour effectuer la supervision des sauvegardes, celle-ci devant s’envisager en amont pour une protection fiable des données. Sans compter que la supervision servira aussi à contrôler que les capacités de stockage ne sont pas saturées, que les transferts sont performants ou encore que des personnes non autorisées n’accèdent pas aux données.
Un centre de données physiquement sécurisé
Bien qu’il soit possible de demander à vérifier les installations d’un hébergeur cloud, les entreprises clientes d’OVHcloud n’avaient que très peu de prise pour prévenir l’incendie du grand data center alsacien. En revanche, elles possèdent toutes les cartes en main pour protéger leurs propres salles de serveurs, qu’il s’agisse de la principale ou d’une secondaire, et donc pour sécuriser leurs copies de sauvegardes locales. Dans ce contexte d’intégrité plus physique que virtuelle, la supervision revêt là aussi une utilité majeure en agissant à plusieurs niveaux.
En commençant par la surveillance de tous les paramètres environnementaux qui peuvent augurer d’un problème si certains seuils sont dépassés comme la température, l’humidité, le niveau de condensation des climatiseurs, l’état des onduleurs ou la consommation électrique totale du matériel. En cas de valeurs limites atteintes ou de détection d’une corrélation entre deux mesures, des notifications automatiques permettront d’être alerté et d’anticiper un incendie avant même qu’il ne se déclenche. En parallèle, l’outil permettra également d’optimiser sa consommation électrique et de préserver les ressources globales.
N’oublions pas enfin de mentionner les systèmes de restriction d’accès au centre de données, essentiels pour prévenir les intrusions malveillantes. Un lecteur de carte intégré au système de verrous électroniques de la porte permettra de signaler toute tentative d'ouverture non autorisée, complété par une supervision qui contrôlera que le tout fonctionne bien, avec possibilité d’être alerté d’une éventuelle défaillance de l’alimentation électrique, afin de garantir l’accès lors d’une panne de courant. La salle de serveur doit quant à elle être surveillée par le biais de caméras, capteurs de mouvement ou de chaleur pour offrir une vidéosurveillance en continu.
Prendre soin des sauvegardes de données de l’entreprise et disposer d’un véritable plan de reprise d’activité n’est donc pas une mince affaire. Cela repose sur une stratégie réfléchie et complète afin d’offrir une sérénité de l’esprit. La supervision fait figure d’aide cruciale pour réduire grandement les risques, représentant un coût mineur dans un plan d’investissement global de stockage, en regard de l’ensemble des pertes potentielles en cas de problème.