Nvidia corrige un bug dans sa puce Blackwell et annonce une reprise de la production en T4. (Crédit Nvidia)
Mercredi dernier, lors d'une conférence de presse, le CEO de Nvidia, Jensen Huang, a déclaré aux analystes que le problème avait été résolu, sans en préciser la nature ni la solution.
Nvidia a résolu un problème affectant sa dernière puce Blackwell, et devrait être en mesure de reprendre la production au quatrième trimestre. C'est ce qu'a déclaré son CEO aux analystes lors d'une conférence téléphonique sur les résultats organisée mercredi dernier. Annoncé au début du mois août, ce problème avait suscité quelques inquiétudes chez les responsables informatiques des entreprises. « Nous avons modifié le masque du GPU Blackwell afin d'améliorer les rendements de production », a déclaré Jensen Huang. « La montée en puissance de la production de Blackwell est prévue pour le quatrième trimestre et se poursuivra au cours de l'année fiscale 2026. Au quatrième trimestre, nous prévoyons des revenus de plusieurs milliards de dollars pour Blackwell. Les livraisons de Hopper devraient augmenter au cours du second semestre de l'exercice 2025. » L'exercice 2025 de l'entreprise a débuté le 29 janvier 2024.
« Le changement de masque est terminé », a précisé le CEO de Nvidia. « Aucun changement fonctionnel n'a été nécessaire. En ce moment même, nous prélevons des échantillons fonctionnels de Blackwell, Grace Blackwell et de diverses configurations systèmes. Près d'une centaine de types différents de systèmes basés sur Blackwell ont été montrés pendant le Computex, et nous commençons à autoriser l'échantillonnage de notre écosystème. La fonctionnalité de Blackwell est en l'état, et nous prévoyons de démarrer la production au quatrième trimestre », a poursuivi M. Huang, ajoutant que « les livraisons de Blackwell se chiffreront à plusieurs milliards de dollars à la fin de cette année ». Le CEO n'a pas précisé la nature du problème ni la solution apportée.
Pas d'explications précises
L'analyste technologique Jeff Kagan doute que ce retard ait un impact significatif sur les opérations informatiques des entreprises. « Nous avons appris à toujours nous attendre à ce genre de problèmes. Heureusement, ces déconvenues n'arrêtent pas le progrès et la croissance, même si elles peuvent ralentir les choses de temps en temps », a déclaré M. Kagan. « En fin de compte, il ne s'agit pas d'un problème à long terme, mais plutôt d'un des nombreux problèmes à court terme qui seront résolus ». Lors de la conférence téléphonique avec les analystes, M. Huang a également exposé sa vision de l'avenir de l'IT d'entreprise et de l'ampleur avec laquelle l'IA allait modifier la nature du matériel et des opérations informatiques. « Nous avons tellement réduit le coût de l'entraînement des grands modèles de langage ou de l'apprentissage profond qu'il est désormais possible d'avoir des modèles à l'échelle gigantesque, des modèles à plusieurs milliards de paramètres, de les pré-entraîner sur pratiquement tous les corpus de connaissances du monde et de laisser le modèle découvrir comment comprendre la représentation du langage humain, comment codifier les connaissances dans ses réseaux neuronaux et comment apprendre le raisonnement, tout ce qui est à l'origine de la révolution de l'IA générative », a déclaré M. Huang.
Le CEO a aussi fait valoir que les fondements financiers des environnements IT évoluent rapidement. « Chaque fois que l'on double la taille d'un modèle, il faut également plus que doubler la taille de l'ensemble de données pour l'entraîner. Ainsi, la quantité de flops nécessaires pour créer ce modèle augmente de façon quadratique », a-t-il expliqué. « Il n'est pas surprenant de constater que les modèles de la prochaine génération pourraient nécessiter 10, 20 ou 40 fois plus de calculs que ceux de la génération précédente. Nous devons continuer à augmenter les performances générationnelles de manière significative afin de réduire l'énergie consommée et le coût nécessaire pour y parvenir. »
Suivez-nous