Un nouveau benchmark teste la vitesse d'exécution des modèles d'IA : Une puce de Nvidia a été la plus performante dans les tests.

Un groupe de référence en matière d'intelligence artificielle appelé MLCommons a dévoilé lundi les résultats de nouveaux tests qui déterminent la vitesse à laquelle le matériel haut de gamme peut exécuter des modèles d'intelligence artificielle. Le nouveau benchmark MLPerf est basé sur un grand modèle de langage avec 6 milliards de paramètres qui résume les articles de CNN. Le benchmark simule la partie "inférence" du traitement des données de l'IA, qui alimente le logiciel à la base des outils d'IA générative.

La meilleure soumission de Nvidia pour le benchmark d'inférence s'articule autour de huit de ses puces phares H100. Nvidia a dominé le marché de l'entraînement des modèles d'IA, mais n'a pas encore conquis le marché de l'inférence. "Ce que vous voyez, c'est que nous fournissons des performances de premier plan dans tous les domaines, et encore une fois, sur toutes les charges de travail", a déclaré Dave Salvator, directeur du marketing de l'informatique accélérée de Nvidia.

Le succès d'Intel repose sur ses puces Gaudi2 produites par l'unité Habana que la société a acquise en 2019. Le système Gaudi2 était environ 10 % plus lent que le système de Nvidia. "Nous sommes très fiers des résultats de l'inférence, car nous montrons l'avantage de Gaudi2 en termes de prix et de performances", a déclaré Eitan Medina, directeur de l'exploitation de Habana.

Nom : 5.png
Affichages : 1773
Taille : 677,6 Ko

Intel affirme que son système est moins cher que celui de Nvidia, à peu près le prix des systèmes de la dernière génération 100 de Nvidia, mais a refusé de discuter du coût exact de la puce. Nvidia a refusé de discuter du coût de sa puce. Vendredi, Nvidia a déclaré qu'elle prévoyait de déployer prochainement une mise à jour logicielle qui doublerait les performances de son système dans le benchmark MLPerf.

L'unité Google d'Alphabet a présenté en avant-première les performances de la dernière version d'une puce personnalisée qu'elle a annoncée lors de sa conférence sur l'informatique dématérialisée en août.

Source : MLCommons

Et vous ?

Pensez-vous que ces tests sont crédibles ou pertinents ?
Selon vous, quelle est la meilleure puce pour l'utilisation de l'IA ?

Voir aussi :

La puce d'IA Nvidia H100 à 40 000 dollars est devenue le matériel informatique le plus convoité au monde et rapproche Nvidia des 1 000 milliards de dollars de capitalisation boursière

Les limites et perspectives des benchmarks pour évaluer les performances de l'IA par rapport aux performances humaines

Voyager, le tout premier supercalculateur alimenté par les puces d'IA générique d'Intel, il permettra aux scientifiques d'optimiser des algorithmes pour les modèles d'apprentissage automatique