
ControlMonkey automatise les plans de reprise d'activité dans le cloud en se focalisant sur l'infrastructure. (Crédit Photo: ControlMonkey)
Après le Chaos Monkey, une méthode pour éprouver la résilience du système d'information, ControlMonkey veut apporter plus de maîtrise dans les procédures de reprise d'activité dans le cloud.
Le déploiement d'une infrastructure cloud comprend un grand nombre de composants différents. Combien d'entre eux sont réellement sauvegardés pour assurer une bonne reprise d'activité après un sinistre ? C'est une question à laquelle la start-up ControlMonkey, spécialisée dans l'automatisation de l'infrastructure cloud, tente de répondre. Fondée en 2022 et basée en Israël, elle propose une réponse automatisée et focalisée sur l'infrastructure, un point faible dans les plans de reprise d'activité plutôt orientés sur la protection des données ou des applications.
Cette fonctionnalité met à disposition une sauvegarde automatisée et une récupération en un clic des configurations réseau, des paramètres DNS, des configurations CDN, des pare-feu, des groupes de sécurité et d'autres composants de l'infrastructure qui sont essentiels pour la fourniture d'applications, mais souvent négligés dans la planification traditionnelle d'un PRA. ControlMonkey, dont le nom contraste délibérément avec le célèbre outil de test de résilience « Chaos Monkey » de Netflix, adopte une approche opposée. « Chaos Monkey apporte le chaos à votre cloud et ControlMonkey apporte le contrôle », a déclaré Aharon Twizer, CEO et cofondateur de ControlMonkey, à Network World.
Générer du code Terraform pour le PRA cloud
Habituellement, les entreprises se servent d'outils d'infrastructure as code (IaC) comme Terraform pour définir l'environnement de déploiement cloud. ControlMonkey ne cherche pas à remplacer ce dernier, mais plutôt à améliorer le PRA. « La plupart des entreprises ne disposent pas d'une couverture complète de l'ensemble de leur infrastructure dans le cadre de l'infra as code, ce qui entraîne de nombreux angles morts - vous ne savez pas ce que vous ne savez pas », a souligné le dirigeant. En outre, il a noté qu'il peut être difficile de maintenir l'IaC dans un état qui représente toujours la configuration existante. Il y a des choses comme la dérive, les gens qui changent des choses directement dans la console, et d'autres scénarios du monde réel qui ont un impact sur l'infrastructure.
Pour résoudre ce problème, ControlMonkey utilise des algorithmes d'IA pour générer du code Terraform, connu sous le nom de Hashicorp Configuration Language (HCL), pour les environnements cloud existants. Il aide ainsi les clients à atteindre une couverture de 100 % de l'IaC. Une approche de plus en plus courante dans ce domaine est connue sous le nom de GitOps, où les changements de configuration sont effectués dans le référentiel de contrôle de version Git, puis mis en service. ControlMonkey est également en mesure de s'intégrer aux référentiels Git afin d'offrir un meilleur contrôle des modifications de l'infrastructure as a code et des capacités de sauvegarde.
L'objectif de restaurer en un clic
Compte tenu de la complexité des configurations cloud, en particulier dans les environnements multicloud distribués avec des topologies de réseau compliquées, la restauration du service est souvent un exercice non trivial pour la reprise après sinistre. Aharon Twizer affirme que ControlMonkey peut le faire en un seul clic. « La façon dont ControlMonkey fonctionne est de scanner toute votre configuration réelle, génèrer du code Terraform à partir de celle-ci et fournir ensuite une restauration en un clic pour la configuration », a-t-il expliqué. Il ajoute « vous pouvez effectuer des recherches, déterminer quelle configuration a été modifiée et à quel moment, et la restaurer en un seul clic ». Selon lui, cette approche réduit le temps de récupération de 90 % par rapport aux efforts de reconstruction manuelle, une mesure essentielle pour les équipes d'exploitation du réseau qui s'efforcent de minimiser les temps d'arrêt.
La reprise après sinistre n'est pas seulement une procédure qu'il est bon d'avoir, elle fait aussi souvent partie de la conformité réglementaire. « Les normes SOC 2 et ISO 27001 prévoient notamment des plans de reprise après sinistre et de continuité des activités », fait remarquer le dirigeant. « La configuration de l'infrastructure est négligée et la plupart des solutions se concentrent sur les données, mais nous considérons que l'infrastructure as code est en train de devenir une priorité », conclut-il.
Suivez-nous