L'entreprise Compute Exchange met en relation les fournisseurs disposant d'une capacité de calcul excédentaire avec ceux qui en ont besoin. Une seconde vente aux enchères aura lieu à partir du 3 mars.
Les entreprises qui ont besoin d'une capacité de calcul supplémentaire pour leurs initiatives d'intelligence artificielle à un prix abordable disposent désormais d'une nouvelle option. Compute Exchange propose ce qu'il appelle la première bourse d'enchères au monde pour les ressources de calcul d'IA. Grâce à cette platefomre, les entreprises qui ont une capacité de calcul excédentaire peuvent entrer directement en contact avec les entreprises qui en ont besoin. Les acheteurs potentiels peuvent alors faire des offres sur des configurations qui répondent à leurs besoins d'utilisation uniques. La première vente publique a été organisée le mardi 25 février et une seconde aura lieu le lundi 3 mars. « Cette option va vraiment apporter de la transparence, de l'efficacité et de la neutralité aux marchés du calcul », a déclaré Simeon Bochev, cofondateur et CEO de Compute Exchange.
La situation du calcul par GPU est « plutôt désastreuse », selon un analyste
Cette aide est nécessaire de toute urgence. Il est de plus en plus difficile de trouver des ressources GPU pour le traitement de l'IA, à mesure que les contraintes d'approvisionnement se réduisent. « La situation du calcul GPU est assez désastreuse », a alerté Matt Kimball, vice-président et analyste principal pour le calcul et le stockage des centres de données chez Moor Insights & Strategy. « Elle résulte du fait que Nvidia, considéré par la plupart comme un fournisseur unique, vend à un marché insatiable des GPU avant même qu'ils ne soient fabriqués ». Les acheteurs sont également confrontés à des cycles d'approvisionnement longs, à des prix fixes et à des contrats à long terme avec des fournisseurs de cloud qui exigent souvent un minimum de dépenses. « Les capacités sont limitées et les coûts élevés, à tel point qu'il est très difficile pour les personnes qui ne font pas partie des échelons les plus élevés d'avoir un accès facile à ces capacités de calcul », a ajouté M. Bochev.
Démocratiser l'accès au calcul
Compute Exchange se veut une bourse neutre et autorégulée, avec un système d'enchères où les prix sont déterminés par la demande du marché. Les acheteurs ne paient que ce dont ils ont besoin et peuvent revendre les capacités inutilisées. « Compute Exchange est certainement unique », a fait valoir M. Kimball, soulignant que ses concurrents sont soit des fournisseurs de services cloud traditionnels (Cloud Service Provider, CSP) comme AWS ou Microsoft Azure, soit des CSP spécialisés comme CoreWeave et Lambda Labs. » Selon Ilya Matveev, responsable du territoire américain chez Gcore, un fournisseur de la plateforme, la plateforme d'échange donne aux acheteurs « plus de flexibilité, de transparence et d'efficacité sur les coûts, en s'assurant qu'ils obtiennent la meilleure offre basée sur les conditions du marché en temps réel : en supprimant les contraintes de prix fixes, les acheteurs peuvent faire évoluer leurs besoins en capacité de calcul de manière dynamique. »
Un modèle économique d'avenir
Fondé en 2024, Compute Exchange a organisé jusqu'à présent deux ventes aux enchères privées, en collaboration avec une douzaine de fournisseurs, dont Gcore, Nebius et Voltage Park. La plateforme est simple à utiliser. Après avoir créé un compte, les acheteurs précisent leurs besoins en matière de configuration. Les critères peuvent être généraux (le prix le plus bas pour un A100) ou spécifiques (« Je veux un A100 dans une région particulière des États-Unis avec une certaine quantité de mémoire et de stockage qui répond à certains accords de niveau de service »). L'offre est répertoriée sur Computer Exchange en tant que demande juridiquement contraignante, et les utilisateurs savent immédiatement s'ils sont mis en relation avec des fournisseurs. Dans des circonstances normales, les acheteurs peuvent passer des semaines à analyser les différents fournisseurs et leurs conditions de service, mais Compute Exchange dispose d'un accord de service que chaque fournisseur a accepté, ce qui évite cette étape.
La session de mardi comprenait six ventes aux enchères d'infrastructures A100, H100 et H200 sur des serveurs uniques ou des grappes de serveurs (plus de huit GPU). Une période d'offre ouverte sera suivie d'une période de non-annulation qui commencera à 10h00 mercredi, ce qui laissera aux acheteurs une fenêtre de deux heures pour « améliorer les prix ». « À ce moment-là, « chaque fournisseur pourra ajuster son prix à la hausse de manière à ce qu'il corresponde aux conditions du marché », a expliqué M. Bochev. Une fois la vente aux enchères terminée, les acheteurs retenus sont mis en relation avec les fournisseurs et, « dans un délai très court, ils pourront utiliser leur capacité de calcul », a précisé M. Bochev. « Lorsque nous prenons tous ces éléments en compte - neutralité du marché, efficacité du marché, normalisation, réduction de l'opacité et grande facilité à lister exactement ce dont vous avez besoin - cette modalité offre un moteur très convaincant de l'économie de calcul du futur », a avancé M. Bochev.
Bien provisionner pour rester compétitif
« Pour réussir dans les initiatives d'IA, il est également important de dimensionner l'infrastructure en fonction de la charge de travail », a rappelé Alvin Nguyen, analyste principal chez Forrester. Si les modèles ne peuvent pas accéder aux capacités de calcul dont ils ont besoin, « il est possible que la charge de travail de l'IA ne puisse pas être traitée », a-t-il poursuivi. Selon M. Nguyen, pour éviter ce problème, les entreprises devraient adapter leurs objectifs de traitement de l'IA aux ressources qu'elles peuvent raisonnablement acquérir, analyser diverses options pour augmenter le matériel sur site et développer des charges de travail d'IA avec des exigences moins strictes en matière de données et de temps de latence. De plus, comme le souligne M. Matveev, « les entreprises doivent évaluer leurs besoins en charge de travail sur la base de données de performance historiques et définir des indicateurs de performance clés (KPI) clairs pour l'utilisation des ressources afin de dimensionner correctement leurs demandes ». En surveillant les tendances d'utilisation et en se comparant aux normes du secteur, les entreprises peuvent éviter de gaspiller des ressources. « L'examen régulier de ces données et la mise en oeuvre de mécanismes de mise à l'échelle automatisés permettent d'éviter le sur-provisionnement ou le sous-provisionnement, ce qui garantit une utilisation efficace des ressources du cloud. »
Suivez-nous