Taillés pour l'IA, les clusters GPU grignotent les ventes de serveurs

Les DGX H100 de Nvidia séduisent les entreprises désirant déployer leurs propres traitements IA. (Crédit Nvidia)

Les DGX H100 de Nvidia séduisent les entreprises désirant déployer leurs propres traitements IA. (Crédit Nvidia)

Deux rapports d'Omdia dressent un tableau positif de l'impact de l'IA sur les entreprises, ainsi qu'un déclin des livraisons globales de serveurs, les acheteurs donnant la priorité aux systèmes dopés avec des accélérateurs GPU.

L'adoption de l'intelligence artificielle change les habitudes d'achat de serveurs, mais elle a un impact rapide et positif sur les entreprises qui déploient des technologies d'IA. Telles sont les conclusions des deux rapports de recherche du cabinet d'études Omdia. Dans un prochain rapport sur le marché du cloud et des datacenters, le cabinet d'études prévoit une réduction du nombre de livraisons de serveurs pour la première fois depuis 2007. Sauf que, la baisse des ventes de serveurs observée en 2007 résultait de la crise économique mondiale. L'évolution actuelle des achats de serveurs est plus positive. Omdia a constaté que la demande de ressources IT reste élevée. Cependant, le rapport précise aussi que la demande de serveurs plus coûteux dotés de matériel spécialisé pour l'entraînement de modèles d'IA (en clair, des systèmes dopés avec des accélérateurs GPU) est prioritaire par rapport au serveur d'entreprise typique doté uniquement d'un ou deux processeurs. Selon Omdia, 2,8 millions de serveurs ont été vendus au cours du premier trimestre 2023, soit nettement moins que les 3,2 millions prévus à l'origine par le cabinet d'études. « La baisse des livraisons entre le 4ᵉ trimestre 2022 et le 1ᵉʳ trimestre 2023 est la plus importante jamais enregistrée », a déclaré Omdia. 

La peur de rater le coche du marché très actif de l'IA pousse les fournisseurs de services cloud (cloud service provider, CSP) et les entreprises à accroître leurs investissements dans le matériel dédié à l'IA comme les DGX H100 de Nvidia (à partir de 482 000$ HT avec 8 GPU). Une carte Nvidia H100 est vendue au prix non remisé de 40 000$ HT. Cependant, ce dernier est clairement plus cher qu'un serveur traditionnel. Aussi, pour compenser le coût considérable associé aux investissements dans les serveurs IA, les fournisseurs de services cloud et les entreprises retardent le renouvellement de leurs serveurs existants. « Nous constatons un flux important d'investissements dans les clusters d'IA », a déclaré Vladimir Galabov, responsable de la recherche sur le cloud et les datacenters chez Omdia. « Il s'agit de projets de grande envergure. Chaque serveur peut coûter un demi-million de dollars, soit l'équivalent de 50 à 60 serveurs à usage général », a-t-il ajouté. Depuis un certain temps, la tendance est de conserver le matériel déployé plus longtemps. « Auparavant, les serveurs étaient renouvelés tous les trois ou quatre ans. Aujourd'hui, la durée de vie typique des serveurs d'un CSP de niveau 1 est de six ans, alors que les fournisseurs de niveau 2 font état de durées de vie allant jusqu'à 10 ans », a déclaré Omdia.

 

Taillés pour le calcul intensif appliqué à l'IA, les serveurs DGX H100 accueillent jusqu'à huit accélérateurs GPU. (Crédit Nvidia)

D'autres facteurs expliquent le ralentissement des ventes de matériel serveur. Le contexte macroéconomique en est un, de même que l'augmentation des coûts et un accès plus limité au capital pour alimenter les arbitrages en matière d'investissement. L'étude indique également que la plupart des entreprises ont déjà optimisé leurs opérations pour adopter un modèle hybride Capex/Opex, lequel combine l'informatique sur site et les services cloud. « Les entreprises adoptent une stratégie moins risquée qui consiste à utiliser les services cloud pour répondre aux besoins IT à court terme tout en évaluant soigneusement la demande à long terme », a expliqué le cabinet d'études. Cela signifie qu'elles vendent moins de matériel sur site et qu'elles adoptent davantage les services cloud. 

Une IA rapidement rentable Omdia a aussi constaté que les investissements dans l'IA sont très rapidement rentabilisés par l'augmentation du chiffre d'affaires, la réduction des coûts nets et l'amélioration de l'efficacité et de l'expérience client. Bien que relativement récents, les déploiements d'IA ont déjà un impact. Environ 54 % des personnes interrogées ont déclaré un gain de 1% ou plus de leurs résultats, et 14 % ont constaté un retour sur investissement de 11 % ou plus, selon la catégorie. Il convient de noter qu'Omdia a mené son enquête auprès de 369 entreprises en février 2023, c'est-à-dire bien avant que les projets d'IA générative n'aient pu avoir un quelconque impact. Cette étude mesure donc les premiers déploiements de l'IA. Omdia prévoit qu'un retour sur investissement précoce de l'IA accélérera probablement l'innovation en matière d'IA, car de plus en plus d'entreprises en perçoivent les avantages. Les initiatives d'IA générative, en particulier, auront sans doute plus de chances de faire leurs preuves. Au fur et à mesure que les projets d'IA mûrissent au sein des entreprises et que les avantages se font sentir, ces dernières étendront les déploiements d'IA à d'autres cas d'usage et à d'autres domaines d'activité. Avec un ROI tangible pour justifier les programmes, la confiance des directions générales dans l'expansion des initiatives d'IA va grandir, ce qui stimulera à son tour l'augmentation des dépenses.



s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Publicité