Arista ajoute à son OS du load balancing automatisé

Arista propose un équilibrage de charge intelligent et une observabilité centrée sur les tâches d'IA à son OS.

Arista propose un équilibrage de charge intelligent et une observabilité centrée sur les tâches d'IA à son OS.

Arista Networks ajoute l'équilibrage de charge en cluster à son système d'exploitation EOS phare et des capacités de gestion des tâches d'IA à sa plateforme d'observabilité du réseau CloudVision.

Aider les entreprises clientes à développer et à gérer efficacement les environnements réseau d'IA, tel est l'objectif des fonctions d'équilibrage de charge et d'observabilité centrée sur les tâches d'IA ajoutées par Arista Networks à ses principaux produits logiciels. La fonction d'équilibrage de charge et de performance des clusters d'IA fait désormais partie du système d'exploitation Extensible Operating System (EOS) d'Arista, exécuté par l'ensemble de son portefeuille réseaux. Le fournisseur a également renforcé sa solution de gestion CloudVision afin de mieux dépanner les tâches d'IA lorsqu'elles traversent le réseau. 

La fonction Cluster Load Balancing (CLB), qui fait partie de la suite d'outils EOS Smart AI d'Arista pour la gestion des réseaux d'IA, est un package RDMA (Remote Direct Memory Access) basé sur Ethernet qui garantit un usage élevé de la bande passante et une faible latence entre les clusters d'IA et les réseaux spine and leaf auxquels ils sont connectés. « Les tâches d'IA ne peuvent pas tolérer une latence élevée ou des flux lents comme les réseaux traditionnels », a expliqué Praful Bhaidasna, directeur de la gestion des produits chez Arista. « Les tâches d'IA reposent sur le fait que tout doit être terminé avant le passage à l'étape suivante, si bien qu'un seul flux lent peut tout arrêter », a-t-il poursuivi. « Le Cluster Load Balancing fonctionne en observant la connexion RDMA sur Ethernet pour surveiller les flux de trafic, puis en utilisant les informations d'état pour créer une solution d'équilibrage de charge optimale », a ajouté M. Bhaidasna. « Le CLB garantit une faible latence, de sorte qu'il n'y a pas de flux lents et que toutes les liaisons sont utilisées au maximum. Aucun lien ne sera plus encombré qu'un autre du fait de flux importants, car tous les flux sont importants dans le monde de l'IA », a insisté M. Bhaidasna. L'autre caractéristique essentielle du CLB, c'est qu'il est agnostique en matière de GPU et de NIC. « Le CLB garantit une utilisation équilibrée. »




Depuis son introcduction, l'OS d'Arista a gagné en fonctionnalités. (Crédit Arista)

Mises à jour de la plateforme Arista CloudVision


Pour aider les entreprises à gérer l'IA et les environnements réseau, Arista a ajouté à son système CloudVision Universal Network Observability (CV UNO) une observabilité centrée sur les tâches d'IA pour un meilleur dépannage. CV UNO est un composant sous licence de la plateforme CloudVision as-a-service d'Arista qui recueille des données télémétriques et analytiques sur le réseau et les associe à des technologies d'IA et d'apprentissage machine afin d'offrir des informations détaillées en temps réel sur le flux du réseau et la performance des applications, l'analyse des risques et des incidents, et la gestion de l'impact des changements. « CV UNO permettra aux clients de corréler les données du réseau et les mesures des tâches d'IA pour optimiser les performances des tâches d'IA et de repérer les goulets d'étranglement et les problèmes matériels qui affectent les performances de la charge de travail d'IA », a souligné M. Bhaidasna. Le système peut voir les temps d'achèvement des tâches d'IA, les indicateurs de congestion et l'utilisation des tampons/liens afin d'assurer une exécution ininterrompue et hautement efficace des charges de travail d'IA. « Traditionnellement, on considère souvent la santé du réseau à un instant T. Par exemple, des données SNMP remontées à un moment donné indiquent si l'interface est en marche ou en panne, ou si un commutateur est en panne, etc. Mais il n'y a aucune visibilité sur ce qui s'est passé entre temps », a fait remarquer M. Bhaidasna. « CV UNO élimine les conjectures sur ce qui se passe réellement à cet endroit, et l'IA peut repérer les problèmes et proposer des suggestions sur leur résolution avant qu'ils n'aient un impact ».

La fonction Cluster Load Balancing est disponible dès maintenant sur les commutateurs 7260X3, 7280R3 et 7500R3 d'Arista, ainsi que sur la plateforme Etherlink 7800R3. La prise en charge des plateformes 7060X6 et 7060X5 Etherlink est prévue pour le deuxième trimestre 2025. La prise en charge de la plateforme 7800R4 Etherlink 800G AI spine box est prévue pour le second semestre 2025. « CV UNO est disponible dès maintenant, et les améliorations de l'observabilité pour l'IA font l'objet de tests clients actifs, la disponibilité générale étant prévue pour le deuxième trimestre 2025 », a précisé Arista.




s'abonner
aux newsletters

suivez-nous

Publicité

Derniers Dossiers

Publicité