L'ESS 3500 fonctionne avec Spectrum Scale, le système de fichiers distribué Scale-out d'IBM qui couvre les réseaux sur site, dans le cloud et en périphérie. Crédit photo : Quest Software
IBM affirme que les dispositifs de stockage ESS 3500 peuvent améliorer les tâches d'entrainement de l'IA de 70 %.
IBM a enrichi sa gamme de serveurs de stockage d'entreprise Spectrum Scale Enterprise Storage Server (ESS). Destiné à fonctionner avec les serveurs de calcul dense DGX de Nvidia pour les tâches d'entrainement de l'IA, le nouveau ESS 3500 est équipé d'un contrôleur CPU plus rapide et offre un débit plus élevé. Ce modèle 2U est doté de 24 baies de disques et peut offrir une capacité de stockage brute maximum de 368 To. Mais il peut atteindre jusqu'à 1 Pétaoctet (Po) grâce à la compression LZ4, une première pour cette gamme de serveurs ESS, puisque les modèles précédents sont dépourvus de cette fonction. L'ESS 3500 peut atteindre jusqu'à 91 Go/s de débit, contre 80 Go/s pour les anciens modèles.
Une puce AMD Epyc 48 coeurs sur chaque contrôleur
L'ESS 3500 fonctionne avec Spectrum Scale, le système de fichiers distribué Scale-out d'IBM qui couvre les réseaux sur site, dans le cloud et en périphérie. Selon IBM, « Spectrum Scale est une solution de stockage définie par un logiciel et permettant de traiter de grandes quantités de données dans un environnement distribué sur un cluster IBM Spectrum Scale unique ». Le serveur utilise deux contrôleurs actifs avec des ports Ethernet 100Gbit ou InfiniBand 200Gbit HDR et un processeur AMD Epyc 48 coeurs sur chaque contrôleur. Le 3500 cible directement les systèmes de calcul dense DGX de Nvidia, lesquels sont constitués uniquement de GPU et de mémoire, mais pas d'unités de stockage. Pour ce faire, il utilise la technologie GPUDirect Storage de Nvidia, qui crée un chemin de données direct entre les GPU et le stockage via NVMe ou NVMe over Fabrics (NVMe-oF).
Connexion directe entre le stockage et la mémoire du GPU
Normalement, les données doivent être chargées dans le CPU et la mémoire principale avant d'être déplacées vers le GPU pour être traitées. Mais GPUDirect permet au système de contourner complètement le CPU et la mémoire principale et fournit une connexion directe entre le stockage et la mémoire du GPU. IBM affirme qu'avec ce système, le fabricant de pièces automobiles Continental a pu améliorer de 70 % le temps d'entrainement de l'IA pour les véhicules à conduite autonome en utilisant IBM Spectrum Scale et IBM ESS 3500 avec un système DGX. L'ESS 3500 est disponible dès maintenant.
Suivez-nous