RETOUR

IA : Les Xeon 6 6900P et les accélérateurs Gaudi 3 arrivent au catalogue d'Intel

Grâce à l'hyper-threading, le nombre de cœurs des Xeon Granite Rapids est effectivement doublé pour atteindre à 256 threads. (Crédit Intel)

Avec son processeur Xeon 6 Granite Rapids, Intel affirme qu'il apporte des performances deux fois supérieures à celles de son prédécesseur.

Après de nombreuses informations distillées lors de points presse ces derniers mois, Intel a officiellement lancé ses processeurs pour serveurs Xeon 6 6900P Granite Rapids-AP (mono et bisocket 7529) ainsi que les accélérateurs Gaudi 3 pour l'IA, en faisant des déclarations assez audacieuses. Après les Xeon 6 6700E dotés de coeurs d'efficacité (E-cores) avec une consommation d'énergie réduite pour les tâches moins exigeantes, le fondeur commercialise ici les versions haute performance avec cinq modèles dans série Xeon 6 6900P - gravée en Intel3 soit du 5 nm et + Intel7 soit 10 nm pour l'E/S - avec des coeurs performance (P-cores) conçus pour les charges de travail intensives en calcul. Le Xeon 6980P, par exemple, dispose de 504 Mo de cache L3 et fonctionne à 2 GHz par défaut, mais peut augmenter jusqu'à 3,9 GHz en mode turbo, selon la charge de travail.  

Pour augmenter encore les performances globales du système, jusqu'à deux processeurs Xeon 6980P peuvent fonctionner ensemble dans une configuration multiprocesseur (SMP).  (Crédit Intel)

La série 6900P prend en charge six liens Ultra Path Interconnect 2.0 pour des vitesses de transfert CPU à CPU allant jusqu'à 24 Gb/s, jusqu'à 96 lignes PCIe 5.0, dont 64 voies peuvent être réservées au CXL 2.0 pour étendre ses capacités mémoire, stockage flash, GPU ou réseau. Ces Xeon bénéficient de plus d'instructions vectorielles supplémentaires pour le calcul, et une extension matricielle avec un point optimal de 16 bits en virgule flottante pour l'inférence d'IA. Intel affirme que son Xeon 6 6900P offre des performances deux fois supérieures à celles de son prédécesseur grâce à un nombre accru de coeurs, une bande passante mémoire doublée et des capacités d'accélération d'IA intégrées dans chaque coeur.


Intel met en avant les performances

Les caractéristiques des puces Xeon 6900P sont impressionnantes. Par rapport à la génération précédente de Xeon, le nombre maximal de coeurs est doublé - jusqu'à 128 avec le 6980P facturé 17 800$ HT- en utilisant une conception en chiplets. Ainsi, au lieu d'un grand morceau de silicium, le processeur est divisé en trois parties plus faciles à fabriquer. Le Xeon 6 est de plus le premier processeur à prendre en charge les modules MRDIMM de Micron, qui améliorent les performances en termes de bande passante et de latence. Dans le cas du Xeon 6900P, le gain monte jusqu'à 57% pour atteindre 8 800 MT/s (millions de transferts par seconde). 

Comme à son habitude, Intel a ajouté des instructions supplémentaires à sa puce Xeon pour accélérer certains calculs. (Crédit Intel)

Le nombre accru de coeurs a cependant un prix, et c'est la consommation d'énergie. La puissance thermique de conception (TDP) pour quatre des cinq processeurs de la famille 6900P est de 500 watts, tandis qu'une seule puce consomme 400 watts (la 6952P). En comparaison, le Xeon de cinquième génération avait un TDP maximum de 350 watts. Mais il y a indéniablement un gain de performance. Dans le benchmark utilisant un chatbot Llama 2 de 7 milliards de paramètres, le Xeon 6972P à 96 coeurs d'Intel est plus de trois fois plus rapide que l'Epyc 9654 Genoa à 96 coeurs d'AMD et 128% plus rapide que la génération précédente de Xeon. Dans un benchmark de traitement du langage Bert, le Xeon 6972P est 4,3 fois plus rapide que l'Epyc 9654 et 2,2 fois plus performant que la génération précédente de Xeon. Il convient toutefois de noter que le processeur Epyc utilisé dans les benchmarks est arrivé sur le marché depuis deux ans, et qu'AMD devrait bientôt sortir une nouvelle génération de processeurs.

Gaudi 3 pour revenir sur le marché de l'IA

Enfin, prenant pour cible Nvidia, Intel commercialise la puce d'accélération IA Gaudi 3 (gravée en 5 NM chez TSMC), qui, selon elle, est 40 % plus économe en énergie en moyenne que les puces Nvidia H100 similaires. "L'accélérateur d'IA Intel Gaudi 3 alimentera des systèmes d'IA comptant jusqu'à des dizaines de milliers d'accélérateurs connectés via le standard commun d'Ethernet ", a déclaré Intel. Par exemple, 24 ports Ethernet 200 gigabits sont intégrés dans chaque accélérateur Intel Gaudi 3, offrant une mise en réseau flexible et standard. Il promet d'offrir 4 fois plus de capacités de calcul IA et une bande passante mémoire 1,5 fois supérieure à son prédécesseur, le Gaudi 2, ce qui permettra un dimensionnement efficace pour prendre en charge des grappes de calcul volumineuses et éliminer le verrouillage propriétaire des équipementiers grâce aux infrastructures réseau exclusives, souligne Intel. L'idée est que l'accélérateur puisse offrir une performance décuplée pour les modèles d'entraînement et d'inférence IA, offrant aux entreprises un choix plus large de systèmes à déployer lors du passage à l'IA générative à grande échelle, a déclaré M. Katti.

Edition du 01/10/2024, par Serge Leblal






Sur le même sujet

RETOUR