Après avoir levé 500 M$, Perplexity rachète Carbon

Stratégie,

Carbon synchronise des sources de données externes utilisées dans des LLM. (crédit : Carbon)

Dans les tuyaux depuis plusieurs mois, la levée de fonds de 500 M$ de Perplexity a été finalement bouclée. La start-up proposant un moteur de recherche à base de GenAI a aussi racheté Carbon, outil de traitement et d'automatisation de la synchronisation des données sources pour maintenir à jour des applications.

Depuis octobre dernier, les bruits de couloir concernant une très probable levée de fonds de 500 M$ de Perplexity s'étaient multipliés. Ce financement est désormais acquis : selon Bloomberg, qui tient son information d'une source proche du dossier, la start-up a clôturé ce dernier tour de table. Avec pour conséquence de faire grimper sa valorisation de 3 Md$ à 9 Md$. En avril dernier, Perplexity était valorisé "seulement" à 1 Md$. Ce tour de table a été mené par Institutional Venture Partners et s'est achevé début décembre. Outre SoftBank, Perplexity bénéficie par ailleurs aussi du soutien de Nvidia et de Jeff Bezos, fondateur d'Amazon. Accusé à plusieurs reprises de plagiat, la société a depuis signé plusieurs partenariats de partage des revenus avec de grandes publications, dont Time et Fortune.

En parallèle de cette levée, Perplexity a annoncé le rachat de Carbon. "Nous sommes heureux d'annoncer que nous avons acquis Carbon, un moteur de recherche qui connecte des sources de données externes à des LLM. Avec son service Connect, la société fondée en 2022 à Seattle, fournit une interface de téléchargement de contenu depuis différentes sources comprenant aussi bien Dropbox, OneDrive, que des sites web et des fichiers téléchargés. "Une fois authentifié, Carbon traite les données de la source et automatise leur synchronisation pour maintenir l'application à jour", précise l'éditeur. Son CEO, Derek Tu a ajouté "cette intégration proposera au moteur de réponse de Perplexity d'accéder plus facilement à des informations provenant de diverses sources, que ces données soient stockées dans des bases de données internes, dans un espace de stockage cloud ou dans des référentiels documentaires"

Faciliter le RAG

Accessible via une API REST ou un SDK cet outil sert à synchroniser des sources de données externes utilisées dans des LLM, et dispose d'intégrations natives avec plus d'une vingtaine de connecteurs et supporte aussi plus d'une vingtaine de formats de fichiers (texte, audio et image). La récupération des données se fait dans plusieurs formats : fichier original (PDF, CSV, etc.), texte brut analysé, parties de documents (chunks) et représentations vectorielles (embeddings) à stocker dans un entrepôt de données vectorielles, recherche sémantique, par mot-clé et hybride sur une base de données vectorielles managée ou gérée directement par le client. Carbon est censé également simplifier le processus de génération augmentée de récupération (RAG) en évitant aux utilisateurs de passer plus de temps à ingérer les données dans leurs systèmes plutôt qu'à les exploiter.

Le service Connect de Carbon gère les applications tierces et les téléchargements de fichiers plus efficacement avec les composants React prêts à l'emploi. Il propose aussi un composant prédéfini pour l'authentification (OAuth, clés d'accès à l'API, etc.), la gestion des comptes, le téléchargement et la synchronisation des fichiers.

Par Dominique Filippone