AMD s'attaque à Intel et Nvidia avec ses dernières puces pour datacenter

Reposant sur l'architecture Zen5, les puces Epyc 9005 Turin se déclinent en deux versions : performance ou plus de coeurs. (Crédit AMD)

La cinquième génération de puces AMD Epyc (nom de code Turin) pour serveurs apporte des performances ou plus de coeurs pour un large éventail de charges de travail dans les datacenters. En complément, les GPU Instinct MI325X se positionnent face à l'ogre Nvidia sur le marché de l'accélération des traitements IA.

Quelques semaines après Intel et ses Xeon 6, AMD a annoncé ses derniers processeurs dédiés à l'intelligence artificielle et au calcul haute performance lors de son événement Advancing AI à San Francisco, avec notamment la cinquième génération de ses puces Epyc 9005 Turin (de 8 à 192 coeurs avec une fréquence allant jusqu'à 5 GHz) pour serveurs et les accélérateurs GPU Instinct MI325X. Des engagements de la part de grands clients et partenaires, tels que Microsoft, OpenAI, Meta, Oracle et Google Cloud, ont également marqué cet événement. Les CPU Epyc de cinquième génération se déclinent en deux configurations distinctes, toutes deux faisant partie de la même famille 9005, également appelée Turin. La version scale-up dispose de coeurs Zen 5 optimisés pour des performances maximales, selon AMD. Les modèles scale-out sont équipés de coeurs compacts Zen 5c, un concept introduit cette année avec la ligne Zen 4c Bergamo. Intel adopte une stratégie similaire avec ses coeurs Performance et Efficacité, mais ses coeurs Efficacité sont obtenus en supprimant certaines instructions, ce qui peut poser des risques pour la compatibilité des applications. AMD, de son côté, a obtenu ses coeurs compacts en limitant la taille du cache et la vitesse d'horloge, tout en conservant l'ensemble des instructions.

Les CPU Zen 5 comportent jusqu'à 128 coeurs et 256 threads et sont fabriqués avec le procédé 4 nm de TSMC. Gravé en 3 nm, toujours chez TSMC, les puces Zen 5c proposent jusqu'à 192 coeurs et 384 threads . Les processeurs basés sur Zen 5 ont une consommation d'énergie maximale de 500 watts, tandis que les modèles 5c plafonnent à 390 watts. Coté muscles, AMD affirme que son processeur vedette, l'Epyc 9965 à 192 coeurs, est 2,7 fois plus rapide que le Xeon concurrent d'Intel, le Platinum 8952+ (Emerald Rapids soit un Xeon de 5eme génération). AMD revendique également un encodage vidéo quatre fois plus rapide, des performances 3,9 fois supérieures dans les applications de calcul haute performance, et jusqu'à 1,6 fois plus de performance par coeur dans les environnements virtualisés.

Les Instinct s'attaquent à Nvidia AMD cherche à livrer une guerre sur deux fronts, à la fois contre Intel et Nvidia. La société entend en effet concurrencer Nvidia dans le domaine des accélérateurs pour l'intelligence artificielle avec ses GPU Instinct. Bien qu'il ne possède qu'une fraction du marché de Nvidia, AMD a tout de même enregistré des succès, notamment avec le superordinateur le plus rapide du monde, le Frontier. Pour atteindre cet objectif, AMD commercialise le Instinct MI325X avec une capacité et une bande passante mémoire supérieures à celles de l'Instinct MI300X, qui a été lancé en décembre dernier. Le MI325X est basé sur la même architecture GPU CDNA 3, avec 192 Go de mémoire à large bande passante HBM3 et 5,3 To/s de bande passante mémoire, contre 3,9 To/s pour le MI300X. AMD affirme que les performances d'inférence en IA du MI325X offrent une capacité de traitement 40 % plus rapide avec un modèle Mixtral à 8 groupes et 7 milliards de paramètres, par rapport au Hopper H200 de Nvidia (aujourd'hui dépassé par la puce Blackwell et les accélérateurs GB200). Le MI325X présente également une latence inférieure de 30 % avec un modèle Mixtral de 7 milliards de paramètres, et une latence inférieure de 20 % avec un modèle Llama 3.1 de 70 milliards de paramètres.

Les accélérateurs Instinct MI325X, reposant sur l'architecture CDNA 3, exploitent 192 Go de mémoire HBM3. (Crédit AMD)

Pour progresser sur le marché du HPC, AMD prévoit de lancer une plateforme à huit noeuds pour l'année prochaine, similaire aux serveurs DGX de Nvidia. Avec huit GPU MI325X connectés via l'Infinity Fabric d'AMD, cette plateforme proposera 2 To de mémoire HBM3e, 48 To/s de bande passante mémoire totale, 20,8 pétaflops de performances en FP8, et 10,4 pétaflops de performances en FP16, selon le fournisseur de Santa Clara. Le MI325X sera expédié dans des systèmes de Dell Technologies, Lenovo, Supermicro, Hewlett Packard Enterprise, Gigabyte et plusieurs autres fournisseurs de serveurs à partir du premier trimestre de l'année prochaine, a indiqué l'entreprise.