Les achats massifs de GPU Nvidia par les clients chinois pourraient aggraver la pénurie

Nvidia pourrait devoir faire patienter d'autres clients si elle veut honorer les 16 milliards de dollars de commandes en suspens de clients chinois pour ses accélérateurs GPU, notamment le H20 - une version bridée du H100 Hooper -, avant l'entrée en vigueur d'une éventuelle interdiction de vente à la Chine par le gouvernement américain.


La pénurie de puces d'IA pourrait s'aggraver un peu plus, car les clients chinois pourraient chercher à constituer des stocks de puces Nvidia avant les restrictions de l'administration américaine. Des sources internes citées par The Information laissent entendre qu'au cours des trois premiers mois de cette année, des entreprises chinoises comme ByteDance, Alibaba Group et Tencent Holdings ont commandé pour au moins 16 Md$ d'accélérateurs GPU H20 à Nvidia pour l'exécution de charges de travail d'IA. Selon certains observateurs de l'industrie, cela signifie qu'il pourrait choisir de concentrer ses efforts sur la fabrication d'un plus grand nombre de ces puces pour répondre à cette demande massive avant l'entrée en vigueur de l'interdiction du 13 janvier 2025 et honorer au moins une grande partie de ses commandes. Cette décision pourrait cependant à son tour ralentir la fabrication de ses autres puces et conduire à des goulets d'étranglement encore plus importants. Une situation obligeant alors les clients américains et européens à attendre encore plus longtemps pour obtenir les très recherchées modèles du groupe. La société américaine n'a pour le moment pas répondu à une demande de commentaires sur le sujet.

Restrictions américaines Vs circuits alternatifs Le H20 est le GPU le plus puissant que Nvidia est autorisé à vendre en Chine conformément aux restrictions à l'export imposées en octobre 2023 par l'administration américaine. Il supporte un maximum de 96 Go de mémoire HBM3 opérant à un maximum de 4 To/s avec NVLink (900 Go/s) et PCIe Gen5 x16 (128 Go/s), tout en développant 1 TFLOPS de puissance de calcul en FP64 et 44 TFLOPS en en FP32 pour 400 W de TDP. La puce H100 reste néanmoins 85% plus performante en FP64 selon les comparaisons internes performantes, mais elle est interdite à la vente en Chine, même si des circuits secondaires sont apparus avec des portes d'entrée à Singapour par exemple. Dans le même temps, Pékin envisagerait des contrôles encore plus stricts sur les ventes de puces étrangères pour réduire l'influence croissante de Nvidia et pousser les entreprises chinoises à acheter des composants locaux, chez Huawei par exemple. « Le gouvernement chinois soutient et subventionne les fabricants locaux pour qu'ils produisent des puces à base d'ARM », a expliqué Lidice Fernandez, vice-présidente du groupe IDC pour les trackers mondiaux sur les infrastructures d'entreprise.

Les pénuries se poursuivent C'est en octobre 2022 que les États-Unis ont, pour la première fois, imposé des contrôles à l'exportation sur les puces envoyées en Chine, afin de ralentir les progrès technologiques du pays. Ils ont bloqué la vente des GPU A100 et H100 de Nvidia, conduisant le fournisseur de Santa Clara à développer des puces A800 et H800 moins puissantes pour le marché chinois. Mais celles-ci ont également été interdites par la suite. La demande en puces H20 a explosé après l'arrivée, en janvier, du modèle d'IA open source très bon marché de la start-up chinoise Deepseek. Même si le H20 est 15 fois plus lent que les derniers GPU H200 (Blackwell), l'accélérateur a été développé spécifiquement par Nvidia pour se conformer aux restrictions sur les exportations américaines introduites en octobre 2023. « Elle est utilisée par des entreprises chinoises pour la formation, même si elle présentée comme une puce d'inférence », a expliqué Matt Kimball, vice-président et analyste principal pour le calcul et le stockage dans les centres de données chez Moor Insights & Strategy.

Cependant, même si Nvidia concentre ses efforts sur la fabrication d'un plus grand nombre de puces, M. Kimball ne pense pas que cela aura un impact sur l'approvisionnement aux États-Unis et en Europe, étant donné que Blackwell est le principal produit vendu sur ces marchés et que le H20 est une puce d'architecture Hopper N-1 [dégradée]. « Si la question est de savoir si cette commande importante ralentit la production de puces destinées aux États-Unis et à l'Europe, je dirais que la réponse est non, car la famille Hopper est construite sur un noeud de processus différent de celui de la famille Blackwell », a-t-il avancé. Néanmoins, ce dernier fait remarquer que « la gestion de la chaîne d'approvisionnement est difficile, en particulier pour les petites entreprises qui sont reléguées à l'arrière de la file d'attente alors que les grandes entreprises dont les commandes atteignent plusieurs milliards de dollars sont les premières à s'approvisionner en puces les plus récentes. »

Les principales restrictions sur les GPU à l'exportation des États-Unis

Les restrictions américaines sur les GPU, motivées par des préoccupations de sécurité nationale, visent les accélérateurs pour l'IA qui dépassent certains seuils de performance. L'objectif ? Empêcher la Chine d'utiliser des puces avancées pour des applications militaires, de surveillance et de supercalcul. Les contrôles portent principalement sur :

- Puissance de calcul brute : les restrictions s'appliquent aux GPU dont les performances FP64 dépassent 4,8 TFLOPS ou les performances FP32 dépassent 9,7 TFLOPS ;

- Accélération de l'IA : les accélérateurs dont les performances de coeur de tenseur sont supérieures à 125 TOPS (téraopérations par seconde) sont bloquées ;

- Bande passante mémoire limitée à 1,8 To/s: les technologies de mémoire et d'interconnexion à haut débit, essentielles pour l'entraînement de l'IA, sont également limitées.

Les GPU tels que les A100, H100 et H200, qui offrent une bande passante mémoire supérieure à 1,5 To/s, sont directement concernés par ces interdictions. La logique derrière ces mesures est simple : ralentir la croissance de l'IA en Chine en lui refusant les accélérateurs les plus performants.

s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Publicité