Après les mainframes Z, l'accélérateur IA Spyre sera aussi proposé avec les systèmes Power. (Crédit IBM)
La feuille de route des serveurs Unix Power pour 2025 et au-delà vient d'être dévoilée par IBM.
Les plans d'IBM pour sa famille de serveurs Unix Power promettent des capacités de traitements IA plus rapides et programmables ainsi qu'un processeur PowerPC plus puissant. Les points saillants de cette feuille de route 2025 incluent :
- L'accélérateur Spyre pour l'IA sera proposé avec les systèmes Power.
- La gamme de serveurs Power sera centrée autour d'un processeur PowerPC, le Power11.
- Un assistant basé sur l'IA aidera à la modernisation et au développement d'applications RPG.
« Conçue conjointement par IBM Research et IBM Infrastructure, l'architecture de l'accélérateur Spyre est prévue pour une computation IA plus efficace. Notamment, la puce enverra les données directement d'un moteur de calcul à un autre, entraînant une utilisation efficace de l'énergie », a écrit Bargav Balakrishnan, vice-président en chrage des produits Power chez IBM, dans un blog sur la feuille de route. « Cette famille de processeurs utilise également une gamme de formats numériques de moindre précision (comme les [types de données IA] int4 et int8), pour rendre l'exécution d'un modèle IA plus économe en énergie et bien moins gourmande en mémoire », a ajouté le dirigeant. Selon big blue, l'accélérateur Spyre augmente considérablement la vitesse et la précision des capacités de traitement IA sur les systèmes Power. En déchargeant les tâches IA sur l'accélérateur, les serveurs peuvent obtenir des gains de performance, entraînant des temps de réponse plus rapides et une efficacité globale du système améliorée. Rappelons qu'IBM avait présenté son accélérateur Spyre en aout dernier ainsi que ses processeurs Telum II, qui équiperont l'année prochaine les mainframes Z et LinuxONE. L'accélérateur Spyre accueille 1 To de mémoire et 32 unités de traitement IA qui partageront une architecture similaire à celle de l'accélérateur IA intégré dans la puce Telum II, selon IBM. Chaque Spyre est monté sur une carte PCIe. Des détails supplémentaires sur les plans de l'accélérateur IBM Spyre seront révélés en 2025, a ajouté M. Balakrishnan.
Le Power11 sur les rails
Du côté des serveurs, le système Power11 présente des innovations au niveau du processeur, de l'OS Aix et de la pile logicielle pour aider les entreprises à réaliser leurs initiatives de transformation numérique pour leur infrastructure clef, a souligné M. Balakrishnan. « IBM Power continue également de prendre en charge les cas d'utilisation IA émergents dans les entreprises avec l'architecture MMA (Matrix-Math Assist) », a écrit le responsable. MMA est une fonctionnalité des serveurs basés sur Power10 qui gère les opérations de multiplication de matrices en matériel, plutôt que de compter uniquement sur les routines logicielles. Cela offre une performance quatre fois supérieure par coeur pour les noyaux de multiplication de matrices à la même fréquence, selon IBM.
« Le processeur Power11 est conçu pour offrir des vitesses d'horloge plus élevées et peut ajouter jusqu'à 25 % de coeurs supplémentaires par puce par rapport aux systèmes IBM Power10 comparables », a précisé M. Balakrishnan. « Le Power11 s'appuie sur les capacités clefs que nous avons introduites avec Power10, notamment des caractéristiques de fiabilité, disponibilité et service (RAS) renforcées, une meilleure efficacité énergétique et gestion de l'énergie, et une sécurité quantique améliorée », a-t-il déclaré. Le processeur disposera d'une technologie de condensateur empilé intégré (ISC) et d'un packaging 2.5D ainsi que d'innovations dans le refroidissement, comme des dissipateurs thermiques améliorés et des ventilateurs plus efficaces pour optimiser la distribution d'énergie, améliorer la résistance des fils et des coeurs et augmenter la capacité du système, selon un blog de William Starke, ingénieur distingué et architecte en chef des processeurs Power chez IBM. De plus, les systèmes Power11 exploiteront des modules mémoire DDR5 Dual in-Line récemment sortis et des interfaces Open Memory Interface (OMI) améliorées, qui permettent une fiabilité, une capacité et une bande passante de mémoire accrues. Étant donné que l'OMI est une technologie agnostique, la gamme Power11 construite sur le processeur Power11 prendra également en charge la mémoire DDR4 OMI migrée des systèmes haut de gamme Power10, permettant aux clients de protéger leurs investissements en technologie de mémoire, a déclaré Starke.
Un Power S1012 taillé pour l'edge
Big blue a passé une bonne partie de 2024 à développer des fonctionnalités pour maintenir les serveurs Power pertinents pour les environnements serveurs actuels. Par exemple, en octobre dernier, le fournisseur a développé son infrastructure en tant que service Power Virtual Server, qui propose des « pods » de calcul, de stockage et d'infrastructure réseau pour des environnements sur site privés ou gérés dans le cloud IBM. La société a ajouté une fonction Power Virtual Server Private Cloud qui permet aux clients de mieux contrôler et gérer les ressources Power localement ou dans un environnement cloud hybride, selon un communique de presse. En mai, la firme d'Armonk a complété l'entrée de gamme de son portefeuille Power avec le serveur S1012 monté en rack 2U conçu pour exécuter des charges de travail d'inférence IA dans des bureaux distants ou des emplacements de périphérie en dehors des centres de données d'entreprise. Mono socket, demi-largeur et basé sur le processeur Power10, ce serveur promet une augmentation de performance trois fois supérieure par coeur par rapport au Power S812 qu'il remplace, a déclaré IBM. Exécutant les systèmes d'exploitation AIX, i, Linux ou VIOS, le Power S1012 prend en charge l'inférence IA et l'apprentissage automatique avec la fonction MMA. Chaque S1012 comprend quatre MMA par coeur pour prendre en charge l'inférence IA.
L'avenir de Power repose sur les chiplets
Le dernier composant de la feuille de route Power d'IBM concerne les orientations matérielles après le serveur Power11. Le fournisseur a spécifiquement précisé que les futurs systèmes Power migreront vers une architecture basée sur des chiplets après le Power11, selon M. Starke. « L'idée est d'augmenter le contenu en silicium effectif par socket, tout en contrôlant les coûts et en gérant l'énergie et le refroidissement », a expliqué l'ingénieur. « Nous avons également découvert qu'une conception basée sur les chiplets permettra d'améliorer les topologies des systèmes, ouvrant la voie à des améliorations continues en matière d'extension des grands systèmes pour les générations à venir. » Les conceptions basées sur des chiplets permettent généralement une conception modulaire, permettant de combiner et de faire correspondre des composants spécifiques d'un système en fonction des besoins. Intel, AMD, Xilinx et d'autres construisent actuellement des systèmes basés sur des chiplets.
Développement de RPG
Le principal système de développement d'applications largement utilisé par les serveurs Power et son écosystème est RPG (Rational Open Access). IBM a déclaré qu'il travaille avec les développeurs de la communauté i pour créer des assistants basés sur l'IA qui pourraient aider les clients et développeurs d'entreprise à utiliser du code optimisé genAI pour le développement RPG. En 2025, IBM prévoit de livrer un assistant de code pour RPG - un outil d'IA générative qui aide les développeurs de logiciels IBM i à comprendre le code RPG existant, créer de nouvelles fonctions RPG à l'aide de descriptions en langage naturel, et générer automatiquement des cas de test pour le code RPG, a indiqué big blue.
Suivez-nous