NVIDIA lance les modèles ouverts Nemotron 3 pour créer des systèmes d'agents IA évolutifs avec jusqu'à 500 milliards de paramètres, ainsi que des ensembles de données et des bibliothèques
NVIDIA a présenté la famille de modèles ouverts Nemotron 3, ainsi que des ensembles de données et des bibliothèques visant à faire progresser l'IA agentielle dans tous les secteurs. La famille de modèles ouverts Nemotron 3, disponible en versions Nano, Super et Ultra, est la gamme de modèles ouverts la plus efficace et la plus précise pour la création d'applications d'agents IA. Des benchmarks indépendants placent Nemotron 3 Nano en tête de sa catégorie en termes d'ouverture, d'efficacité et de précision.
Un grand modèle de langage (LLM) est un modèle de langage entraîné à l'aide d'un apprentissage automatique auto-supervisé sur une grande quantité de texte, conçu pour les tâches de traitement du langage naturel, en particulier la génération de langage. Les LLM les plus grands et les plus performants sont des transformateurs génératifs pré-entraînés (GPT) qui fournissent les capacités de base des chatbots modernes. Les LLM peuvent être affinés pour des tâches spécifiques ou guidés par l'ingénierie rapide. Ces modèles acquièrent un pouvoir prédictif concernant la syntaxe, la sémantique et les ontologies inhérentes aux corpus linguistiques humains, mais ils héritent également des inexactitudes et des biais présents dans les données sur lesquelles ils sont entraînés.
NVIDIA Nemotron est une famille de modèles, d'ensembles de données et de technologies ouverts qui vous permettent de créer des systèmes d'agents IA efficaces, précis et spécialisés. Conçus pour le raisonnement avancé, le codage, la compréhension visuelle, les tâches agentives, la sécurité et la recherche d'informations, les modèles Nemotron sont librement accessibles et intégrés à l'écosystème de l'IA, ce qui permet de les déployer partout, de la périphérie au cloud. Grâce à des données d'entraînement transparentes et à une large prise en charge des plateformes, notamment RTX PRO et DGX Spark, Nemotron facilite la création et le déploiement d'agents IA fiables et performants.
Récemment, NVIDIA a présenté la famille de modèles ouverts Nemotron 3, ainsi que des ensembles de données et des bibliothèques visant à faire progresser l'IA agentielle dans tous les secteurs. Les modèles utilisent une architecture hybride de mélange latent d'experts conçue pour réduire la surcharge de communication, limiter la dérive contextuelle et diminuer les coûts d'inférence tout en prenant en charge des systèmes multi-agents évolutifs.
La gamme comprend trois variantes : Nemotron 3 Nano avec 30 milliards de paramètres et 3 milliards actifs par tâche, Super avec 100 milliards de paramètres et 10 milliards actifs par jeton, et Ultra avec 500 milliards de paramètres et 50 milliards actifs par jeton. Cette gamme permet aux développeurs d'aligner leur choix de modèle sur la complexité de la charge de travail et les objectifs de coût. Par rapport à Nemotron 2 Nano, le modèle Nano offre un débit jusqu'à quatre fois supérieur, réduit la génération de jetons de raisonnement jusqu'à 60 % et prend en charge les tâches à long terme avec une fenêtre contextuelle d'un million de jetons.
Des benchmarks indépendants placent Nemotron 3 Nano en tête de sa catégorie en termes d'ouverture, d'efficacité et de précision. Nemotron 3 Super et Ultra utilisent l'entraînement NVFP4 à quatre bits sur l'architecture NVIDIA Blackwell afin de réduire l'utilisation de la mémoire et d'accélérer l'entraînement. Nemotron 3 Nano est disponible via Hugging Face, plusieurs fournisseurs d'inférence tels que Together AI, OpenRouter ou Fireworks AI, et en tant que microservice NVIDIA NIM, tandis que Super et Ultra sont attendus au cours du premier semestre 2026.
Cette annonce intervient alors que le PDG de Nvidia, Jensen Huang, a sévèrement réprimandé les cadres qui exhortaient les employés à réduire l'utilisation de l'IA, soulignant son intégration dans toutes les opérations. Il a assuré au personnel que l'adoption de l'IA n'entraînerait pas de pertes d'emplois, soulignant l'expansion et les embauches continues de NVIDIA. La croissance impressionnante du chiffre d'affaires et la domination du marché de l'entreprise soulignent son engagement à accélérer l'IA.
Voici l'annonce de Nvidia :
NVIDIA lance la famille de modèles ouverts Nemotron 3
NVIDIA a annoncé aujourd'hui la gamme NVIDIA Nemotro 3 de modèles, données et bibliothèques ouverts conçus pour permettre le développement transparent, efficace et spécialisé d'une IA agentielle dans tous les secteurs.
Les modèles Nemotron 3, disponibles en tailles Nano, Super et Ultra, introduisent une architecture hybride révolutionnaire de mélange d'experts latents (MoE) qui aide les développeurs à créer et à déployer des systèmes multi-agents fiables à grande échelle.
Alors que les entreprises passent des chatbots à modèle unique à des systèmes d'IA multi-agents collaboratifs, les développeurs sont confrontés à des défis croissants, notamment la surcharge de communication, la dérive contextuelle et les coûts d'inférence élevés. De plus, les développeurs ont besoin de transparence pour faire confiance aux modèles qui automatiseront leurs workflows complexes. Nemotron 3 répond directement à ces défis en offrant les performances et l'ouverture dont les clients ont besoin pour créer une IA agentielle spécialisée.
« L'innovation ouverte est le fondement du progrès de l'IA », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « Avec Nemotron, nous transformons l'IA avancée en une plateforme ouverte qui offre aux développeurs la transparence et l'efficacité dont ils ont besoin pour créer des systèmes agentiels à grande échelle. »
NVIDIA Nemotron soutient les efforts plus larges de NVIDIA en matière d'IA souveraine, avec des organisations d'Europe et de Corée du Sud qui adoptent des modèles ouverts, transparents et efficaces leur permettant de créer des systèmes d'IA adaptés à leurs propres données, réglementations et valeurs.
Les premiers utilisateurs, notamment Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys et Zoom, intègrent les modèles de la famille Nemotron pour alimenter les flux de travail IA dans les secteurs de la fabrication, de la cybersécurité, du développement logiciel, des médias, des communications et d'autres industries.
« NVIDIA et ServiceNow façonnent l'avenir de l'IA depuis des années, et le meilleur reste à venir », a déclaré Bill McDermott, président-directeur général de ServiceNow. « Aujourd'hui, nous faisons un grand pas en avant en donnant aux dirigeants de tous les secteurs les moyens d'accélérer leur stratégie d'IA agentielle. L'automatisation intelligente des workflows de ServiceNow, combinée à NVIDIA Nemotron 3, continuera à définir la norme avec une efficacité, une rapidité et une précision inégalées. »
À mesure que les systèmes d'IA multi-agents se développent, les développeurs s'appuient de plus en plus sur des modèles propriétaires pour bénéficier d'un raisonnement de pointe, tout en utilisant des modèles ouverts plus efficaces et personnalisables afin de réduire les coûts. Le routage des tâches entre les modèles de pointe et Nemotron dans un workflow unique offre aux agents une intelligence optimale tout en optimisant l'utilisation des jetons.
« Perplexity repose sur l'idée que la curiosité humaine sera amplifiée par une IA précise intégrée à des outils exceptionnels, tels que les assistants IA », a déclaré Aravind Srinivas, PDG de Perplexity. « Grâce à notre routeur d'agents, nous pouvons diriger les charges de travail vers les modèles ouverts les mieux adaptés, tels que Nemotron 3 Ultra, ou tirer parti des modèles propriétaires de pointe lorsque les tâches bénéficient de leurs capacités uniques, garantissant ainsi que nos assistants IA fonctionnent avec une vitesse, une efficacité et une échelle exceptionnelles. »
Les modèles ouverts Nemotron 3 permettent aux startups de créer et d'itérer plus rapidement sur des agents IA et d'accélérer l'innovation, du prototype au déploiement en entreprise. Les sociétés du portefeuille de General Catalyst, Mayfield et Sierra Ventures explorent Nemotron 3 pour créer des coéquipiers IA qui soutiennent la collaboration entre l'homme et l'IA.
« La pile de modèles ouverts de NVIDIA et le programme NVIDIA Inception fournissent aux entreprises en phase de démarrage les modèles, les outils et une infrastructure rentable pour expérimenter, se différencier et évoluer rapidement », a déclaré Navin Chaddha, associé directeur chez Mayfield. « Nemotron 3 permet aux fondateurs de se lancer rapidement dans la création d'applications d'IA agentielle et de coéquipiers IA, et les aide à tirer parti de l'énorme base installée de NVIDIA. »
Nemotron 3 réinvente l'IA multi-agents avec efficacité et précision
La famille de modèles MoE Nemotron 3 comprend trois tailles :
- Nemotron 3 Nano, un petit modèle de 30 milliards de paramètres qui active jusqu'à 3 milliards de paramètres à la fois pour des tâches ciblées et hautement efficaces.
- Nemotron 3 Super, un modèle de raisonnement de haute précision avec environ 100 milliards de paramètres et jusqu'à 10 milliards actifs par jeton, pour les applications multi-agents.
- Nemotron 3 Ultra, un grand moteur de raisonnement avec environ 500 milliards de paramètres et jusqu'à 50 milliards actifs par jeton, pour les applications d'IA complexes.
Disponible dès aujourd'hui, Nemotron 3 Nano est le modèle le plus rentable en termes de calcul, optimisé pour des tâches telles que le débogage de logiciels, la synthèse de contenu, les workflows d'assistants IA et la recherche d'informations à faible coût d'inférence. Le modèle utilise une architecture MoE hybride unique pour offrir des gains d'efficacité et d'évolutivité.
Cette conception permet d'atteindre un débit de jetons jusqu'à 4 fois supérieur à celui de Nemotron 2 Nano et de réduire la génération de jetons de raisonnement jusqu'à 60 %, ce qui diminue considérablement les coûts d'inférence. Avec une fenêtre contextuelle d'un million de jetons, Nemotron 3 Nano mémorise davantage, ce qui le rend plus précis et plus apte à relier des informations dans le cadre de tâches longues et en plusieurs étapes.
Artificial Analysis, un organisme indépendant qui évalue les performances de l'IA, a classé ce modèle comme le plus ouvert et le plus efficace parmi les modèles de même taille, avec une précision de pointe.
Nemotron 3 Super excelle dans les applications qui nécessitent la collaboration de nombreux agents pour accomplir des tâches complexes avec une faible latence. Nemotron 3 Ultra sert de moteur de raisonnement avancé pour les workflows d'IA qui exigent des recherches approfondies et une planification stratégique.
Nemotron 3 Super et Ultra utilisent le format d'entraînement NVFP4 4 bits ultra-efficace de NVIDIA sur l'architecture NVIDIA Blackwell, ce qui réduit considérablement les besoins en mémoire et accélère l'entraînement. Cette efficacité permet d'entraîner des modèles plus grands sur l'infrastructure existante sans compromettre la précision par rapport aux formats de plus haute précision.
Avec la famille de modèles Nemotron 3, les développeurs peuvent choisir le modèle ouvert adapté à leurs charges de travail spécifiques, passant de dizaines à des centaines d'agents tout en bénéficiant d'un raisonnement à long terme plus rapide et plus précis pour les workflows complexes.
Nouveaux outils et données ouverts pour la personnalisation des agents IA
NVIDIA a également publié une collection de jeux de données d'entraînement et de bibliothèques d'apprentissage par renforcement de pointe, accessibles à toute personne développant des agents IA spécialisés.
Trois mille milliards de jetons provenant des nouveaux ensembles de données de pré-entraînement, de post-entraînement et d'apprentissage par renforcement Nemotron fournissent les exemples riches en raisonnement, en codage et en workflows à plusieurs étapes nécessaires pour créer des agents hautement performants et spécialisés dans un domaine particulier. L'ensemble de données Nemotron Agentic Safety fournit des données télémétriques réelles pour aider les équipes à évaluer et à renforcer la sécurité des systèmes d'agents complexes.
Afin d'accélérer le développement, NVIDIA a publié les bibliothèques open source NeMo Gym et NeMo RL, qui fournissent les environnements d'entraînement et les bases post-entraînement pour les modèles Nemotron, ainsi que NeMo Evaluator pour valider la sécurité et les performances des modèles. Tous les outils et ensembles de données sont désormais disponibles sur GitHub et Hugging Face.
Nemotron 3 est pris en charge par LM Studio, llama.cpp, SGLang et vLLM. De plus, Prime Intellect et Unsloth intègrent les environnements de formation prêts à l'emploi de NeMo Gym directement dans leurs workflows, offrant ainsi aux équipes un accès plus rapide et plus facile à une formation puissante en apprentissage par renforcement.
Source : Nvidia
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
NVIDIA vient de lâcher une bombe : son nouveau modèle d'IA multimodale NVLM 1.0 72B est ouvert, massif et prêt à rivaliser avec GPT-4. Le modèle est à poids ouvert avec une licence non commerciale cc-by-nc-4.0
Google lance le premier "système d'agents d'IA" au monde, le projet Oscar, une plateforme open-source qui permet aux équipes de développement d'utiliser des agents d'IA pour gérer des projets logiciels
Block, Anthropic et OpenAI ont lancé la Fondation Agentic AI sous l'égide de la Fondation Linux afin d'établir des normes ouvertes pour les agents IA, promouvoir l'interopérabilité et réduire la fragmentation






Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation
Partager