MooseFS joue la carte open source pour son stockage distribué

Avec MooseFS, les fichiers sont distribués sur plusieurs serveurs, comme s'il s'agissait d'un seul volume, nous a expliqué Jakub Ratajczak, cofondateur et CEO de MooseFS. (Crédit S.L.)

Avec MooseFS, les fichiers sont distribués sur plusieurs serveurs, comme s'il s'agissait d'un seul volume, nous a expliqué Jakub Ratajczak, cofondateur et CEO de MooseFS. (Crédit S.L.)

En pleine ère du big data et de l'IA à tous les étages, la gestion des grands volumes de données non structurées est devenue un enjeu crucial pour les entreprises dans tous les secteurs. MooseFS, un système de fichiers parallèle et distribué open source, se positionne comme une réponse adaptée pour répondre à ces défis. Retour sur les avantages et spécificités de cette solution développée par une équipe polonaise depuis près de vingt ans.  

Imaginez une entreprise qui, en pleine expansion, voit ses données non structurées croître de manière exponentielle, menaçant de saturer ses serveurs. Avec la montée en puissance du big data et de l'intelligence artificielle, cette situation est devenue monnaie courante. Dans ce contexte, les entreprises recherchent des solutions de stockage à la fois performantes, évolutives et économiques. C'est ici qu'intervient MooseFS, une solution de stockage parallèle et distribuée (fichier ou bloc) développée par une équipe polonaise installée à Varsovie. Né en 2005 d'un spin-off de Gemius, MooseFS venait répondre au besoin d'une entreprise spécialisée dans la mesure du trafic Internet (Gemius en l'occurrence). Piloté par Jakub Ratajczak (cofondateur et CEO de MooseFS), ce système de fichiers est passé d'un projet interne à une solution adoptée par des entreprises dans le monde entier, couvrant divers secteurs allant de la météo à l'éducation. En France, un grand groupe industriel a mis en place un cluster MooseFS d'une capacité 6 Po pour stocker les données provenant de différents capteurs.  

Scalabilité et performance au coeur du système    MooseFS se distingue par sa capacité à gérer d'immenses volumes de données. Capable de stocker jusqu'à 16 exaoctets de data et de gérer plus de deux milliards de fichiers dans un seul cluster, ce système est taillé pour les entreprises manipulant de très grandes quantités d'informations. En ajoutant simplement de nouveaux noeuds de stockage à un cluster, les utilisateurs peuvent faire croître leur infrastructure sans interruption ni temps d'arrêt, une fonctionnalité essentielle pour les environnements nécessitant une disponibilité constante. Outre cette scalabilité impressionnante, MooseFS optimise les opérations de lecture et d'écriture grâce à un accès en parallèle aux données, éliminant ainsi les goulets d'étranglement et maximisant le débit. Cette architecture décentralisée permet également d'éviter les pannes critiques en assurant une redondance des données et des métadonnées sur plusieurs serveurs avec le recours à l'erasure coding (Reed-Salomon).  



Système de fichiers parallèle et distribué, MooseFS repose sur une batterie de serveurs en mode scale-out jusqu'à 16 exaoctets.

Un des atouts majeurs de MooseFS réside dans sa capacité à garantir la sécurité des données. Les mécanismes de redondance, combinés à des protocoles d'accès conformes aux normes techniques Posix, assurent que les données sont non seulement protégées, mais aussi disponibles en permanence. Pour les environnements critiques, MooseFS Pro offre des fonctionnalités telles que le "self-healing", c'est-à-dire l'autoréparation des données en cas de défaillance matérielle, et la gestion des instantanés, permettant de capturer à tout moment l'état des fichiers sans interruption. Un autre point fort est l'indépendance matérielle offerte par MooseFS. La solution est compatible avec une grande variété de lecteurs (NVMe, Sata ou SAS avec des SSD et des DD), et ne requiert aucun matériel spécifique, permettant ainsi aux entreprises d'utiliser des composants standards tout en évitant le verrouillage fournisseur.  

Un modèle tarifaire simple Le modèle économique de MooseFS repose sur deux déclinaisons : une version open source sans support et une version commerciale, baptisée MooseFS PRO. Cette dernière, tout en partageant 98% de son code avec la version communautaire, propose des fonctionnalités avancées et un support technique dédié. L'une des particularités de cette entreprise est de proposer un système de licence unique, sans frais cachés ni abonnements. En payant une seule fois, les clients bénéficient d'un accès à vie aux mises à jour et aux nouvelles fonctionnalités, tout en gardant la possibilité d'étendre leur stockage à mesure que leurs besoins évoluent. Signalons qu'un fork de MooseFS a été lancé suite au départ d'un des développeurs polonais l'équipe, Piotr Modrzyk, qui a contribué au lancement de SaunaFS au sein de Leil Storage. Le faible coût total de possession (TCO) de MooseFS est souvent cité comme l'un de ses principaux atouts. En offrant une solution open source combinée à une version professionnelle aux coûts maîtrisés, MooseFS permet aux entreprises de réduire leurs investissements initiaux tout en garantissant une extensibilité à moindre coût.  

Dans un monde où l'intelligence artificielle et les analyses de données massives deviennent omniprésentes, MooseFS se positionne comme une solution supportant les charges de travail les plus exigeantes, telles que les modèles d'IA. De plus, MooseFS permet de catégoriser les données et de les stocker sur différents types de supports, optimisant ainsi les coûts en fonction de la fréquence d'accès aux données (données chaudes sur des lecteurs rapides et données froides sur des lecteurs plus lents). Sans surprise, MooseFS ciblent les fournisseurs de services cloud et les entreprises qui sont l'impossibilité de déplacer - pour des questions de conformité - leurs données dans le cloud. Et, le principal argument de l'éditeur polonais pour les séduire est - à prestations égales - un tarif moins élevé que celui des concurrents.   

s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Publicité