Google ouvre Falcon, un transport matériel fiable à faible latence, à l'écosystème, permettant de moderniser Ethernet afin de répondre aux exigences de mise en réseau de l'avenir axé sur l'IA.

Chez Google, ils ont une longue histoire de résolution de problèmes à grande échelle en utilisant Ethernet et en repensant la couche de transport pour satisfaire les charges de travail exigeantes qui nécessitent une large bande passante en rafale, des taux de messages élevés et une faible latence. Les charges de travail telles que le stockage ont besoin de certains de ces attributs depuis longtemps, mais avec les nouveaux cas d'utilisation tels que l'entraînement AI/ML à grande échelle et le calcul haute performance (HPC), le besoin a augmenté de manière significative.

Par le passé, Google a ouvertement partagé avec l'industrie ses connaissances en matière de modelage du trafic, de contrôle de la congestion, d'équilibrage de la charge, etc. en soumettant ses idées à l'Association for Computing Machinery et à l'Internet Engineering Task Force. Ces idées ont été mises en œuvre dans des logiciels et quelques-unes dans du matériel depuis plusieurs années. Mais Google pense que l'industrie dans son ensemble bénéficiera davantage de la mise en œuvre de l'ensemble avec une assistance matérielle dédiée et flexible.

Pour atteindre cet objectif, Google a développé Falcon afin de permettre une amélioration des performances par rapport aux transports uniquement logiciels. Aujourd'hui, lors du sommet mondial de l'OCP, Google ouvre Falcon à l'écosystème par l'intermédiaire de l'Open Compute Project, le lieu naturel pour permettre à la communauté de bénéficier des enseignements de Google en matière de production afin de contribuer à la modernisation de l'Ethernet.

En tant que couche de transport assistée par matériel, Falcon est conçu pour être fiable, performant et à faible latence, et s'appuie sur des technologies éprouvées en production telles que Carousel, Snap, Swift, PLB et CSIG.

Nom : 1.jpg
Affichages : 1434
Taille : 118,9 Ko

Les couches de Falcon sont illustrées dans la figure ci-dessous, avec leur fonction associée. Il y est montré les protocoles RDMA et NVM Express™ Upper layer (ULP), mais Falcon est extensible à d'autres ULP selon les besoins de l'écosystème.

Nom : 2.jpg
Affichages : 740
Taille : 113,2 Ko

Les couches inférieures de Falcon utilisent trois idées clés pour obtenir une faible latence dans les réseaux de centre de données Ethernet à large bande passante, mais avec perte. Des mesures fines du temps d'aller-retour (RTT) assistées par le matériel, avec une mise en forme du trafic flexible et renforcée par le matériel pour chaque flux, et des retransmissions de paquets rapides et précises, sont associées à des connexions Falcon compatibles avec les trajets multiples et cryptées par PSP. Sur cette base, Falcon a été conçu dès le départ comme un transport multiprotocole capable de prendre en charge des ULP dont les exigences en matière de performances et la sémantique des applications varient considérablement. La couche de mappage ULP offre non seulement une compatibilité prête à l'emploi avec les ULP Infiniband Verbs RDMA et NVMe, mais comprend également des innovations supplémentaires essentielles pour les applications à l'échelle de l'entrepôt, telles que la sémantique de commande flexible et la gestion gracieuse des erreurs. Enfin, le matériel et le logiciel sont conçus pour fonctionner ensemble afin d'atteindre les attributs souhaités, à savoir un taux de messages élevé, une faible latence et une large bande passante, tout en conservant la flexibilité nécessaire à la programmabilité et à l'innovation continue.

Falcon reflète le rôle central qu'Ethernet continue de jouer dans notre industrie. Falcon est conçu pour offrir des performances élevées et prévisibles à l'échelle de l'entrepôt, ainsi que pour être flexible et extensible. Google est impatient de travailler avec la communauté et les partenaires de l'industrie pour moderniser Ethernet afin de répondre aux exigences de mise en réseau de l'avenir axé sur l'IA. Google pense que Falcon sera un complément précieux aux autres efforts en cours dans ce domaine.

Perspectives de l'industrie

Les partenaires de l'industrie sont enthousiastes quant à la promesse que Falcon représente pour le développement de la prochaine génération d'Ethernet.

"Nous nous félicitons de la contribution de Google à Falcon, car il partage la vision de l'Ultra Ethernet Consortium de faire de l'Ethernet la meilleure structure de centre de données pour l'IA et le HPC, et nous sommes impatients de poursuivre les innovations de l'industrie dans cet espace important."
- J Metz, président de l'Ultra Ethernet Consortium (dirigé par AMD, Arista, Broadcom, Cisco, Eviden, Hewlett Packard Enterprise, Intel, Meta, Microsoft et Oracle).
"Falcon est d'abord disponible dans la série de produits Intel IPU E2000. La valeur de ces IPU est d'autant plus grande qu'il s'agit de la première instance d'un transport Ethernet permettant d'ajouter une faible latence et une gestion de la congestion à grande échelle. Intel est un membre directeur du Consortium Ultra Ethernet, qui travaille à l'évolution de l'Ethernet pour les charges de travail de l'IA et du HPC à haute performance. Nous prévoyons de déployer les améliorations basées sur les normes qui en résultent dans les futurs produits IPU et Ethernet."
- Sachin Katti, SVP & GM, Network and Edge Group, Intel
"Nous sommes heureux de voir un protocole de transport haute performance pour les charges de travail critiques telles que l'IA et le HPC qui fonctionne sur des réseaux Ethernet/IP standard et permet une bande passante d'application massive à l'échelle."
- Hugh Holbrook, vice-président du groupe, ingénieur logiciel, Arista Networks
"Cisco se réjouit de la contribution de Falcon à l'OCP. Cisco soutient depuis longtemps les normes ouvertes et croit en de larges écosystèmes. Le rythme et l'échelle des réseaux de centres de données modernes, et en particulier des réseaux AI/ML, sont sans précédent, ce qui représente un défi et une opportunité pour l'industrie. Falcon répond à de nombreux défis de ces réseaux, permettant une utilisation efficace du réseau."
- Ofer Iny, Cisco Fellow, Cisco
"Juniper est un fervent défenseur des écosystèmes ouverts, et nous sommes donc heureux de voir Falcon s'ouvrir à la communauté OCP. Falcon permet à Ethernet de servir de réseau de centre de données de choix pour les charges de travail exigeantes, en fournissant une large bande passante, une faible latence et une atténuation de la congestion. Falcon fournit aujourd'hui à l'industrie une solution éprouvée pour les charges de travail exigeantes en matière d'IA et de ML."
- Raj Yavatkar, directeur de la technologie, Juniper
"Marvell soutient fortement l'écosystème Ethernet ouvert et s'engage à le faire évoluer pour prendre en charge les charges de travail émergentes et exigeantes telles que l'IA. Nous saluons la contribution de Falcon à l'OCP et nous nous réjouissons que Google partage ses expériences pratiques avec l'industrie."
- Nick Kucharewski, SVP & GM Network Switching Group, Marvell
Source : Google

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi :

Quels réseaux pour les centres informatiques de demain ? Les besoins en stockage semblent derrière l'explosion d'Ethernet

Bob Metcalfe, inventeur d'Ethernet, nommé lauréat 2022 du prix ACM A.M. Turing, en reconnaissance de sa contribution à l'invention, à la normalisation et à la commercialisation d'Ethernet

100x plus rapide que le WiFi : LiFi, la norme de mise en réseau basée sur la lumière est publiée, les partisans de la norme 802.11bb affirment qu'elle est 100 fois plus rapide que le WiFi