Arnaud Muller, fondateur et CEO de Saagie, veut démocratiser l'utilisation des plateformes big data pour tous les métiers.
Installée au Petit-Quevilly, la start-up Saagie veut mettre sa plate-forme d'analyse big data à la portée de tous les métiers avec une mise en route en quelques heures. Récemment rejoint par Jérôme Trédan, un ancien de Microsoft, la société a développé un PaaS apportant tous les outils de traitement de données (ETL, base MongoDB, framework Hadoop, Spark 2.0, etc.), à consommer à volonté.
La start-up normande Saagie, qui s'est engouffrée il y a trois ans dans la spirale big data, ambitionne de « démocratiser » ces projets avec deux solutions de plateformes as-a-service, Kumo et Su. La première est accessible dans le cloud Azure de Microsoft, la deuxième s'exploite à partir d'une appliance logée dans un rack 5U, à installer dans un datacenter et infogérée à distance par les équipes de Saagie. Cette entreprise, sur laquelle beaucoup de fées semblent s'être penchées, vient de lever 4,2 M€ auprès de cinq investisseurs. Parmi eux, le fonds indépendant CapHorn Invest (150 dirigeants d'entreprise et membres de familles industrielles) dit vouloir investir dans des start-ups capables transformer les marchés traditionnels par le numérique. A ses côtés se trouvent BNP Paribas, dont l'accélérateur WAI (We are Innovation) a accompagné Saagie, ainsi que la filiale d'investissement de Bouygues Construction, la Matmut et l'accélérateur normand privé NFactory. Ces nouveaux actionnaires rejoignent les investisseurs historiques : Thefamilily, Kima Ventures (Xavier Niel), NCI (Normandie Capital Investissement) et Végéo Capital. Saagie est également accéléré par Bpifrance.
Créée en 2013 par son CEO Arnaud Muller sous le nom de Creative Data, la start-up installée au Petit-Quevilly a pris en mai 2016 le nom de sa plateforme, Saagie, dans une logique d'internationalisation de l'offre. Sa solution est déjà utilisée par de nombreuses entreprises en France avec une grande variété d'applications, dans les secteurs industriels tout autant que dans les domaines du marketing. Parmi les principaux clients figurent Vente-privee.com, Johnson&Johnson, Bouygues Energies & Services, Ferrero et Caisse d'Epargne Normandie. Après avoir créé la société seul, Arnaud Muller a été rejoint par deux associés, Youen Chené, CTO, et Marie Peixoto, CFO. Aujourd'hui, la structure compte 25 personnes, dont les 2/3 se consacrent à la R&D et aux services. Un ancien cadre de Microsoft France, Jérôme Trédan, vient d'intégrer le comité de direction et de prendre le poste de vice-président, responsable des ventes et du marketing.
Une plateforme mise à jour de façon continue
Les évolutions se succèdent rapidement dans le monde du big data. La plateforme est donc mise à jour de façon régulière pour faire bénéficier les clients des avancées technologiques, nous a expliqué Arnaud Muller. Il est possible de la connecter à des outils d'intégration et de restitution de données externes, mais pour se conformer à sa promesse de démocratiser ce type de projets, l'éditeur normand la livre avec ses propres outils, d'une part Saagie Manager pour orchestrer toute la chaîne de traitement, alimenter le data lake « en codant ou en cliquant » et construire les modèles prédictifs ; d'autre part, Saagie Present pour les restitutions sous forme de reporting, « en mode story telling ».
« Nous pensons que nous sommes dans un monde d'applications plus que d'outils BI », souligne le fondateur de la start-up. Il commercialise son appliance 5 000 euros par mois dans un environnement de test permettant de gérer 5 To de données. Côté Hadoop, la plateforme repose sur la version open source du framework avec HDFS, mais elle intègre aussi Impala et Drill, ainsi que Sqoop pour décharger les données dans le datalake, Spark 2.0 pour gérer les flux de données et la base de données MongoDB. Elle s'appuie aussi sur les architectures Lambda/Kappa pour pouvoir mixer batch et streaming, par exemple pour les applications de maintenance industrielle. Saagie supporte par ailleurs la technologie de containers Docker.
Demain, la BI sera conversationnelle
Pour passer en production et industrialiser le projet sur des instances de plusieurs téraoctets (entre 5 à 10 To), avec « des machines qui ronronnent », le support d'une équipe de 20 ingénieurs 24/24 et des engagements de services, il faut compter 7 500 euros/mois, nous a indiqué Arnaud Muller. Saagie ne facture pas de licences à l'utilisateur nommé pour utiliser ses applications. Le mot d'ordre de la start-up normande, c'est de permettre une consommation sans limite de la technologie : « all you can eat », insiste le CEO français. En dehors d'Azure pour la version cloud, le PaaS de Saagie s'appuie aussi sur 140 serveurs hébergés dans le datacenter green de Webaxys à Sotteville-lès-Rouen.
Sur l'appliance 5U qui sera prochainement transparente, le héron choisi par Saagie se nourrit de la donnée et casse les silos en prenant de la hauteur, résume le fondateur de la start-up.
La société a déjà noué de nombreux partenariats. Elle travaille étroitement avec Microsoft, pour la version Azure de son offre et pour développer le connecteur Power BI, entre autres. Elle a aussi noué un partenariat avec Econocom et une alliance avec KPMG sur les projets big data, notamment dans le cadre de l'Insights Center, un espace collaboratif consacré à l'analyse des données où le cabinet d'audit et de conseil reçoit les entreprises, à la Défense. En amont, Saagie cherche aussi des synergies avec des start-ups qui ont développé des expertises dans l'analyse sémantique et le deep learning, par exemple sur l'analyse vidéo en temps réel. L'un des objectifs est de pouvoir reconnaître le texte, l'image et la voix et Saagie collabore avec Happie dans ce domaine. « Demain, la BI sera conversationnelle », assure Arnaud Muller. « Nous avons dans la roadmap un bot pour traiter les données en langage naturel et traduire le français et l'anglais en requêtes SQL ». Sur la feuille de route de Saagie, ces fonctionnalités sont prévues pour début 2017, ainsi que des outils de gouvernance permettant de garantir la traçabilité et la fiabilité des données de bout en bout.
Suivez-nous