Le PDG de NVIDIA dévoile des plates-formes d'IA générative pour chaque industrie : la présentation à COMPUTEX a montré de nouveaux systèmes, logiciels et services pour exploiter l'IA générative
La présentation à COMPUTEX a montré de nouveaux systèmes, logiciels et services - dont beaucoup sont alimentés par des superpuces Grace Hopper - pour exploiter l'IA générative, la technologie la plus transformatrice de notre époque.
Pour sa première conférence en direct depuis la pandémie, Jensen Huang, fondateur et CEO de NVIDIA, a donné le coup d'envoi de la conférence COMPUTEX à Taipei, en annonçant les plates-formes que les entreprises peuvent utiliser pour surfer sur la vague historique de l'IA générative qui transforme les industries, de la publicité à la fabrication en passant par les télécommunications.
"Nous sommes de retour", a déclaré M. Huang en montant sur scène après des années de présentations virtuelles, parfois depuis sa cuisine. "Je n'ai pas fait de discours en public depuis près de quatre ans - souhaitez-moi bonne chance !"
S'exprimant pendant près de deux heures devant une salle comble de quelque 3 500 personnes, il a décrit les services, logiciels et systèmes informatiques accélérés qui permettent de créer de nouveaux modèles d'entreprise et de rendre les modèles actuels plus efficaces.
"L'informatique accélérée et l'IA réinventent l'informatique", a déclaré M. Huang, dont les déplacements dans sa ville natale au cours de la semaine écoulée ont été suivis quotidiennement par les médias locaux.
Pour démontrer la puissance de ces technologies, il a utilisé l'énorme mur 8K devant lequel il s'exprimait pour afficher une invite textuelle générant une chanson thème pour son discours, pouvant être chantée comme n'importe quel air de karaoké. M. Huang, qui s'est parfois entretenu avec la foule dans sa langue maternelle, le taïwanais, a brièvement entraîné le public à chanter le nouvel hymne.
"Nous sommes maintenant au point de basculement d'une nouvelle ère informatique avec l'informatique accélérée et l'IA qui a été adoptée par presque toutes les sociétés informatiques et de cloud dans le monde", a-t-il déclaré, notant que 40 000 grandes entreprises et 15 000 startups utilisent désormais les technologies NVIDIA avec 25 millions de téléchargements du logiciel CUDA rien que l'année dernière.
Un nouveau moteur pour l'IA d'entreprise
Pour les entreprises qui ont besoin du nec plus ultra en matière de performances d'IA, il a dévoilé le DGX GH200, un supercalculateur d'IA à grande mémoire. Il utilise NVIDIA NVLink pour combiner jusqu'à 256 superpuces NVIDIA GH200 Grace Hopper dans une seule GPU de la taille d'un centre de données.
Le Superchip GH200, que Jensen a déclaré être désormais en pleine production, associe une CPU NVIDIA Grace économe en énergie à une GPU NVIDIA H100 Tensor Core haute performance dans un superchip.
Le DGX GH200 offre une performance exaflopique et 144 téraoctets de mémoire partagée, soit près de 500 fois plus que dans un seul système NVIDIA DGX A100 de 320 Go. Cela permet aux développeurs de créer de grands modèles de langage pour les chatbots d'IA générative, des algorithmes complexes pour les systèmes de recommandation et des réseaux neuronaux graphiques utilisés pour la détection des fraudes et l'analyse des données.
Google Cloud, Meta et Microsoft sont parmi les premiers à avoir accès au DGX GH200, qui peut être utilisé comme modèle pour une future infrastructure d'IA générative à grande échelle.
Le supercalculateur d'IA DGX GH200 de NVIDIA délivre 1 exaflop de performance pour l'IA générative.
"Les supercalculateurs DGX GH200 intègrent les technologies de calcul accéléré et de réseau les plus avancées de NVIDIA pour repousser les frontières de l'IA ", a déclaré M. Huang au public de Taipei, dont beaucoup avaient fait la queue devant la salle pendant des heures avant l'ouverture des portes.
NVIDIA construit son propre supercalculateur d'IA, NVIDIA Helios, qui sera mis en ligne cette année. Il utilisera quatre systèmes DGX GH200 reliés au réseau InfiniBand NVIDIA Quantum-2 afin d'augmenter le débit de données pour l'entraînement de grands modèles d'IA.
Le DGX GH200 est le point culminant des centaines de systèmes annoncés lors de l'événement. Ensemble, ils apportent l'IA générative et l'informatique accélérée à des millions d'utilisateurs.
En se penchant sur la situation dans son ensemble, M. Huang a annoncé que plus de 400 configurations de systèmes allaient être mises sur le marché avec les dernières architectures Hopper, Grace, Ada Lovelace et BlueField de NVIDIA. Elles visent à relever les défis les plus complexes en matière d'IA, de science des données et de calcul de haute performance.
Accélération dans toutes les tailles
Pour répondre aux besoins des centres de données de toutes tailles, Huang a annoncé NVIDIA MGX, une architecture de référence modulaire pour créer des serveurs accélérés. Les fabricants de systèmes l'utiliseront pour créer rapidement et à moindre coût plus d'une centaine de configurations de serveurs différentes pour répondre à une large gamme d'applications AI, HPC et NVIDIA Omniverse.
MGX permet aux fabricants de construire des CPU et des serveurs accélérés en utilisant une architecture commune et des composants modulaires. Il prend en charge la gamme complète de GPU, CPU, unités de traitement de données (DPU) et adaptateurs réseau de NVIDIA, ainsi que les processeurs x86 et Arm dans une variété de châssis refroidis par air et par liquide.
QCT et Supermicro seront les premiers à commercialiser les modèles MGX en août. Le système ARS-221GL-NR de Supermicro annoncé au COMPUTEX utilisera le processeur Grace, tandis que le système S74G-2U de QCT, également annoncé lors de l'événement, utilise Grace Hopper.
ASRock Rack, ASUS, GIGABYTE et Pegatron utiliseront également le MGX pour créer des ordinateurs accélérés de nouvelle génération.
La 5G/6G fait appel à Grace Hopper
Par ailleurs, M. Huang a déclaré que NVIDIA contribuait à façonner les futures communications sans fil et vidéo 5G et 6G. Une démonstration a montré comment l'IA fonctionnant sur Grace Hopper transformera les appels vidéo en 2D d'aujourd'hui en expériences 3D plus réalistes, procurant une sensation de présence étonnante.
Jetant les bases de nouveaux types de services, Huang a annoncé que NVIDIA travaillait avec le géant des télécommunications SoftBank pour construire un réseau distribué de centres de données au Japon. Ce réseau fournira des services 5G et des applications d'IA générative sur une plate-forme cloud commune.
Les centres de données utiliseront les superpuces NVIDIA GH200 et les DPU NVIDIA BlueField-3 dans les systèmes modulaires MGX ainsi que les commutateurs Ethernet NVIDIA Spectrum pour fournir le timing extrêmement précis que requiert le protocole 5G. La plate-forme réduira les coûts en augmentant l'efficacité spectrale tout en réduisant la consommation d'énergie.
Les systèmes aideront SoftBank à explorer les applications 5G dans les domaines de la conduite autonome, des usines d'IA, de la réalité augmentée et virtuelle, de la vision par ordinateur et des jumeaux numériques. Les utilisations futures pourraient même inclure la vidéoconférence en 3D et les communications holographiques.
Accélérer les réseaux de clouds
M. Huang a également dévoilé NVIDIA Spectrum-X, une plate-forme réseau conçue pour améliorer les performances et l'efficacité des clouds d'IA basés sur Ethernet. Elle associe les commutateurs Ethernet Spectrum-4 aux DPU BlueField-3 et au logiciel pour multiplier par 1,7 les performances de l'IA et l'efficacité énergétique par rapport aux réseaux Ethernet traditionnels.
NVIDIA Spectrum-X, les commutateurs Spectrum-4 et les DPU BlueField-3 sont disponibles dès maintenant auprès des fabricants de systèmes, notamment Dell Technologies, Lenovo et Supermicro.
Donner vie aux personnages des jeux
L'IA générative a également un impact sur la façon dont les gens jouent.
Huang a annoncé NVIDIA Avatar Cloud Engine (ACE) pour les jeux, un service de fonderie que les développeurs peuvent utiliser pour construire et déployer des modèles d'IA personnalisés pour la parole, la conversation et l'animation. Il permettra aux personnages non jouables d'acquérir des compétences en matière de conversation afin de pouvoir répondre aux questions avec des personnalités réalistes et évolutives.
NVIDIA ACE for Games comprend des modèles de base d'IA tels que NVIDIA Riva pour détecter et transcrire la parole du joueur. Le texte invite NVIDIA NeMo à générer des réponses personnalisées animées par NVIDIA Omniverse Audio2Face.
NVIDIA ACE for Games fournit une chaîne d'outils pour donner vie aux personnages grâce à l'IA générative.
Accélérer l'IA générative sur Windows
Huang a décrit comment NVIDIA et Microsoft collaborent pour stimuler l'innovation sur les PC Windows à l'ère de l'IA générative.
Des outils, des frameworks et des pilotes nouveaux et améliorés facilitent le développement et le déploiement de l'IA par les développeurs de PC. Par exemple, la chaîne d'outils Microsoft Olive pour l'optimisation et le déploiement de modèles d'IA accélérés par la GPU et les nouveaux pilotes graphiques augmenteront les performances de DirectML sur les PC Windows équipés de GPU NVIDIA.
Cette collaboration permettra d'améliorer et d'étendre une base installée de 100 millions de PC équipés de GPU RTX avec Tensor Cores qui améliorent les performances de plus de 400 applications et jeux Windows accélérés par l'IA.
Numérisation des plus grandes industries du monde
L'IA générative ouvre également de nouvelles perspectives dans le secteur de la publicité numérique, qui pèse 700 milliards de dollars.
Par exemple, WPP, la plus grande organisation de services marketing au monde, travaille avec NVIDIA pour construire un moteur de contenu basé sur l'IA générative, le premier du genre, sur Omniverse Cloud.
Lors d'une démonstration, M. Huang a montré comment les équipes créatives connecteront leurs outils de conception 3D, tels qu'Adobe Substance 3D, pour créer des jumeaux numériques des produits du client dans NVIDIA Omniverse. Ensuite, le contenu des outils d'IA générative formés sur des données provenant de sources responsables et construits avec NVIDIA Picasso leur permettra de produire rapidement des décors virtuels. Les clients de WPP peuvent alors utiliser la scène complète pour générer une multitude de publicités, de vidéos et d'expériences 3D pour les marchés mondiaux et les utilisateurs sur n'importe quel appareil web.
"Aujourd'hui, les publicités sont récupérées, mais à l'avenir, lorsque vous engagerez des informations, elles seront en grande partie générées - le modèle informatique a changé ", a déclaré M. Huang.
Les usines forgent l'avenir de l'IA
Avec environ 10 millions d'usines, le secteur manufacturier, qui pèse 46 000 milliards de dollars, est un terrain propice à la numérisation industrielle.
"Les plus grandes industries du monde fabriquent des objets physiques. Les construire d'abord numériquement peut permettre d'économiser des milliards", a déclaré M. Huang.
La présentation a montré comment les fabricants d'électronique, dont Foxconn Industrial Internet, Innodisk, Pegatron, Quanta et Wistron, créent des flux de travail numériques avec les technologies de NVIDIA pour concrétiser la vision d'une usine intelligente entièrement numérique.
Ils utilisent Omniverse et des API d'IA générative pour connecter leurs outils de conception et de fabrication afin de créer des jumeaux numériques d'usines. En outre, ils utilisent NVIDIA Isaac Sim pour simuler et tester des robots et NVIDIA Metropolis, un cadre d'IA de vision, pour l'inspection optique automatisée.
Le dernier composant, NVIDIA Metropolis for Factories, permet de créer des systèmes de contrôle de la qualité personnalisés, ce qui donne aux fabricants un avantage concurrentiel. Il aide les entreprises à développer des applications d'IA de pointe.
L'IA accélère les chaînes d'assemblage
Par exemple, Pegatron, qui fabrique 300 produits dans le monde, dont des ordinateurs portables et des smartphones, crée des usines virtuelles avec Omniverse, Isaac Sim et Metropolis. Cela lui permet de tester des processus dans un environnement simulé, ce qui lui fait gagner du temps et de l'argent.
Pegatron a également utilisé le kit de développement logiciel NVIDIA DeepStream pour développer des applications vidéo intelligentes qui ont permis de décupler le débit.
Foxconn Industrial Internet, une branche de services du plus grand fabricant de technologies au monde, travaille avec les partenaires de NVIDIA Metropolis pour automatiser des parties importantes de ses points d'inspection d'assurance qualité des cartes de circuits imprimés.
Dans une vidéo, M. Huang a montré comment Techman Robot, une filiale de Quanta, a fait appel à NVIDIA Isaac Sim pour optimiser l'inspection sur les lignes de fabrication du géant taïwanais. Il s'agit essentiellement d'utiliser des robots simulés pour former des robots à la fabrication de meilleurs robots.
Par ailleurs, M. Huang a annoncé une nouvelle plate-forme destinée à la prochaine génération de flottes de robots mobiles autonomes (AMR). Isaac AMR permet de simuler, de déployer et de gérer des flottes de robots mobiles autonomes.
Un vaste écosystème de partenaires - dont ADLINK, Aetina, Deloitte, Quantiphi et Siemens - contribue à la mise sur le marché de toutes ces solutions de fabrication, a déclaré M. Huang.
C'est un exemple de plus de la façon dont NVIDIA aide les entreprises à ressentir les avantages de l'IA générative grâce à l'informatique accélérée.
"Cela fait longtemps que je ne vous ai pas vus, j'avais donc beaucoup de choses à vous dire ", a-t-il déclaré à l'issue de son discours de deux heures.
Source : Nvidia
Et vous ?
Qu'en pensez-vous ?
Voir aussi :
Le PDG de Nvidia, Jensen Huang, affirme que ceux qui n'ont pas d'expertise en matière d'IA seront laissés pour compte, et ajoute que l'IA est en bonne voie pour réinventer l'informatique de A à Z
Nvidia affirme que les cryptomonnaies n'apportent rien d'utile à l'humanité et que toute cette puissance de calcul devrait être mieux utilisée, comme pour développer des systèmes d'IA comme ChatGPT
NVIDIA GTC : métavers, IA générative, voiture autonome, quelle est la perspective de NVIDIA sur ces sujets ? Entretien avec Jean-Charles Vasnier, Senior Manager Solution Architect
Partager