A l'occasion du Mobile World Congress 2024, Nvidia a annoncé deux GPU RTX 500 et 1000 (Ada Gen) pour apporter des capacités de traitement IA pour PC portables professionnels. (crédit : Nvidia)
Le bond sans précédent du chiffre d'affaires de Nvidia grâce aux ventes de puces pour l'IA et à l'utilisation du cloud en dit long sur l'avenir de la technologie et son impact sur l'économie.
Le 22 février, l'indice Dow Jones Industrial Average a grimpé de plus de 450 points, dépassant pour la première fois les 39 000 points, en grande partie grâce aux bénéfices d'une entreprise dopée par l'intelligence artificielle et les technologies du cloud. L'entreprise en question est Nvidia, dont la publication des résultats de son quatrième trimestre a aussi permis au S&P 500 d'atteindre un nouveau record et de réaliser sa meilleure progression en une seule journée depuis un an. « La performance opérationnelle solide de Nvidia démontre la force unique de ses offres de plateformes d'IA générative, une technologie de plus en plus adoptée par les industries et dont les cas d'usage se multiplient », a déclaré Raj Joshi, vice-président senior de Moody's Investors Service. Dans les domaines de l'IA et du cloud, Nvidia a multiplié son chiffre d'affaires par cinq sur trois mois, et dégagé un bénéfice net de plus de 12 Md$, dépassant les prévisions de près de 2 Md$. L'action, qui avait glissé pendant quatre séances consécutives avant les résultats de mercredi, a atteint un niveau record le 22 février.
L'atout d'être le seul à proposer une solution full-stack
Les revenus globaux du fabricant de puces ont augmenté de 265 % au quatrième trimestre, des résultats directement liés au fait qu'il est le seul à disposer d'une solution full-stack pour les plateformes d'IA générative (genAI), depuis les GPU programmables et les logiciels jusqu'aux réseaux requis pour les charges de travail modernes dans le cloud. « Le calcul accéléré et la GenIA ont atteint le point de basculement, la demande explose dans le monde entier, chez les entreprises, les industries et les Etats », a déclaré Jensen Huang, fondateur et CEO de Nvidia. « Notre plateforme de centre de données est alimentée par des moteurs de plus en plus diversifiés - la demande de traitement de données, d'entraînement et d'inférence de la part des grands fournisseurs de services cloud et de ceux spécialisés dans le GPU, ainsi que des fournisseurs de logiciels d'entreprise et des fournisseurs Internet grand public. La demande des industries verticales - menées par l'automobile, les services financiers et la santé - atteignent aujourd'hui un niveau de plusieurs milliards de dollars », a ajouté le CEO.
« Au fil du temps, les investisseurs peuvent s'attendre à ce que plus de 50 % du chiffre d'affaires des centres de données de Nvidia provienne de clouds exécutant des services d'IA », a affirmé M. Joshi. La leçon n'a pas échappé aux fournisseurs de cloud comme Google et Amazon, qui ont chacun leur propre GPU pour exécuter les charges de travail centrées sur l'IA. « Amazon possède déjà deux puces, l'une pour l'inférence de l'IA et l'autre pour l'entraînement des modèles », a déclaré M. Joshi. « Cela fait très longtemps que Google est impliqué dans le domaine de l'IA, si bien que l'entreprise dispose également de ses propres TPU - les TPU, ou Tensor Processing Units, sont des puces qui accélèrent l'IA - assez impressionnantes ».
1,8 milliards de puces de traitement de la GenIA d'ici à 2030
Selon ABI Research, l'utilisation croissante de la GenIA ne concerne pas uniquement les serveurs des centres de données. Le cabinet d'études estime ainsi que le volume de puces d'IA pour PC et autres appareils mobiles pour le traitement de la GenIA devrait atteindre plus de 1,8 milliard d'unités d'ici à 2030. « La nouveauté, c'est que les charges de travail de GenIA sont exécutées sur des puces hétérogènes, qui répartissent les charges de travail au niveau matériel entre le CPU, le GPU et le NPU », a expliqué Paul Schell, analyste industriel chez ABI Research, ajoutant que « Qualcomm, MediaTek et Google ont été les premiers à se lancer dans cet espace, car ils produisent tous les trois des jeux de puces exécutant des LLM sur les équipements eux-mêmes. Intel et AMD sont en tête dans le secteur du PC ». Selon M. Joshi, Nvidia est pour le moment difficile à égaler, car « l'entreprise est très en avance sur ses concurrents, y compris sur son plus proche rival, AMD, en termes d'offres d'IA full-stack ».
Le marché des centres de données et des fournisseurs de cloud est déjà confronté à une grave pénurie de GPU dédiés à l'IA et celle-ci devrait se poursuivre pendant la majeure partie de l'année 2024. Cette situation tient en grande partie au lancement par OpenAI de sa plateforme d'IA, GPT 3, en novembre 2022. Or, actuellement, l'entreprise taïwanaise TSMC est l'unique fournisseur de GPU spécialisés pour Nvidia, AMD et d'autres acteurs du marché. Outre TSMC, Intel, Samsung, Micron et Texas Instruments ont tous annoncé leur intention de construire de nouvelles fonderies et usines de fabrication de puces basées aux États-Unis, ou ont déjà commencé à le faire. Cela découle, du moins en partie, du CHIPS Act initié par le Président américain Joe Biden et adopté en 2022. TSMC avait prévu de commencer à produire des puces cette année dans l'une de ses deux fonderies de Phoenix, Arizona. Mais le projet a été reporté à 2027 ou 2028. « Il ne s'agit pas seulement de produire des plaquettes de silicium », a expliqué M. Joshi. « Ces GPU nécessitent un certain type de processus d'emballage spécialisé. C'est ce qui provoque la pénurie, et TSMC a déjà doublé ses capacités sur ce point cette année. Mais la très forte demande ne permet pas de rattraper la pénurie. Certes, l'offre s'améliore de jour en jour, de semaine en semaine, de mois en mois, mais la demande reste forte ».
Les Etats-Unis tentent de rattraper leur retard
Pour encourager la relocalisation de la fabrication de puces ou de la recherche aux États-Unis, le CHIPS Act promet plus de 52 Md$ de subventions ou de prêts. Cependant, à ce jour, pas un dollar de financement n'a été distribué aux fabricants. Selon les chiffres de la Maison-Blanche, au cours des 30 dernières années, la part des États-Unis dans la production mondiale de semi-conducteurs est passée de 37 % à 12 % seulement. Dans le même temps, la part de la Chine dans la fabrication de puces a augmenté de près de 50 % au cours des deux dernières années et représente aujourd'hui environ 18 % de l'offre mondiale. Cependant, le CHIPS Act n'aura que peu d'impact sur la production de semi-conducteurs, du moins au cours des deux prochaines années. « L'argent commencera à couler à court terme, mais il faudra au moins deux ans à Intel et aux autres fabricants avant qu'ils ne commencent à livrer leurs produits. Les volumes deviendront peut-être significatifs en 2026 », a estimé M. Joshi. Entre-temps, la reprise des marchés basée sur la technologie s'est poursuivie vendredi, avec une nouvelle hausse du Dow Jones et du S&P.
Suivez-nous