Google annonce une mise à jour de son modèle d'IA Gemini 3 Deep Think afin qu'il puisse traiter des problèmes complexes du monde réel, il aurait atteint un score sans précédent de 84,6 % sur ARC-AGI-2
Google a annoncé avoir mis à jour son modèle d'IA Gemini 3 Deep Think afin d'accélérer la vitesse à laquelle la technologie traite des problèmes complexes du monde réel. Le PDG de l'entreprise, Sundar Pichai, a qualifié cette mise à jour de « significative », affirmant que le géant technologique avait perfectionné Deep Think en étroite collaboration avec des scientifiques et des chercheurs afin de résoudre des défis « complexes » dans les domaines de la science, de l'ingénierie et des mathématiques avancées, où il n'existe pas toujours une seule bonne réponse.
En novembre 2025, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. Puis en décembre, Google a lancé Gemini 3 Deep Think, un mode d'IA exclusif pour les abonnés Premium, qui améliore le raisonnement pour les tâches mathématiques, scientifiques et logiques complexes grâce à une décomposition méthodique, à des hypothèses parallèles et à l'auto-vérification. Selon les tests, il surpasse les références et s'adresse aux professionnels, positionnant Google à la pointe de l'innovation en matière d'IA avancée.
Récemment, Google a annoncé avoir mis à jour son modèle d'IA Gemini 3 Deep Think afin d'accélérer la vitesse à laquelle la technologie traite des problèmes complexes du monde réel. Le PDG de l'entreprise, Sundar Pichai, a qualifié cette mise à jour de « significative », affirmant que le géant technologique avait perfectionné Deep Think en étroite collaboration avec des scientifiques et des chercheurs afin de résoudre des défis « complexes » dans les domaines de la science, de l'ingénierie et des mathématiques avancées, où il n'existe pas toujours une seule bonne réponse.
Sundar Pichai occupe le poste de PDG de Google depuis 2015 et celui de PDG de sa société mère Alphabet Inc. depuis 2019. Chez Google, il a dirigé la gestion des produits et les efforts d'innovation pour une suite de logiciels clients de Google, notamment Google Chrome et ChromeOS, tout en étant largement responsable de Google Drive. En outre, il a supervisé le développement d'autres applications telles que Gmail et Google Maps.
« Gemini 3 Deep Think bénéficie d'une mise à jour significative. Nous avons perfectionné Deep Think en étroite collaboration avec des scientifiques et des chercheurs afin de relever des défis complexes du monde réel. Et il repousse les limites des benchmarks les plus difficiles, atteignant un score sans précédent de 84,6 % sur ARC-AGI-2. Il établit également une nouvelle norme sur le dernier examen de l'humanité - 48,4 % sans outils », a déclaré Pichai.
Google affirme que Gemini 3 Deep Think « bat des records »
Selon l'entreprise, la version mise à jour de Gemini 3 Deep Think a « pulvérisé » certains des tests les plus difficiles jamais créés pour l'IA, atteignant des niveaux d'intelligence « pionniers ». L'entreprise a souligné que la version améliorée de Gemini 3 Deep Think a obtenu un score de 48,4 % au Humanity's Last Exam (HLE) – un test difficile conçu pour évaluer les modèles linguistiques avancés – sans utiliser aucun outil externe. Il aurait également obtenu un score de 84,6 %, un nouveau record en matière de raisonnement général, dans l'ARC-AGI-2, atteint le niveau « médaille d'or » aux Olympiades internationales de mathématiques 2025 et obtenu un score « Elo » (système de classement) impressionnant de 3455 en programmation compétitive.
Alors que la version précédente excellait en logique, le nouveau Deep Think est désormais présenté comme un « assistant scientifique ». Google affirme qu'il est désormais capable de naviguer dans des domaines complexes tels que la chimie avancée et la physique théorique. Par exemple, les ingénieurs utilisent déjà cet outil pour modéliser des systèmes physiques à l'aide de code, tandis que les chercheurs l'utilisent pour interpréter des ensembles de données complexes qui étaient auparavant trop denses pour être traités efficacement par l'IA, selon Google.
Pour les consommateurs : si vous êtes abonné à Google AI Ultra, vous pouvez accéder dès aujourd'hui au mode Deep Think mis à jour directement dans l'application Gemini. Pour les professionnels : pour la première fois, Google lance un programme d'accès anticipé à l'API Gemini. Cela permet à certains chercheurs, ingénieurs et grandes entreprises de créer leurs propres outils en utilisant la puissance de raisonnement de Deep Think. « Le mode Gemini 3 Deep Think mis à jour est désormais disponible pour les abonnés Ultra dans l'application Gemini. Nous rendons également Deep Think disponible pour la première fois via l'API Gemini à certains chercheurs et entreprises dans le cadre d'un programme d'accès anticipé », a déclaré Pichai.
Cette annonce semble confirmer les déclarations de Geoffrey Hinton, le « parrain de l'IA ». En décembre 2025, il a estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA). Hinton, professeur émérite à l'université de Toronto et ancien expert de Google Brain, s'est également dit surpris que Google ait mis autant de temps à dépasser ses concurrents. Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».
Voici un extrait de l'annonce de Google :
Améliorer le raisonnement grâce à la rigueur mathématique et algorithmique
L'année dernière, nous avons montré que des versions spécialisées de Deep Think pouvaient relever avec succès certains des défis les plus difficiles en matière de raisonnement, obtenant des résultats dignes d'une médaille d'or aux championnats du monde de mathématiques et de programmation. Plus récemment, Deep Think a permis à des agents spécialisés de mener des recherches mathématiques de niveau universitaire.
Le mode Deep Think mis à jour continue de repousser les limites de l'intelligence, atteignant de nouveaux sommets dans les benchmarks académiques les plus rigoureux, notamment :
- Établir une nouvelle norme (48,4 %, sans outils) sur Humanity's Last Exam, un benchmark conçu pour tester les limites des modèles modernes de pointe.
- Atteindre un score sans précédent de 84,6 % sur ARC-AGI-2, vérifié par la ARC Prize Foundation.
- Atteindre un Elo stupéfiant de 3455 sur Codeforces, un benchmark consistant en des défis de programmation compétitifs
- Atteindre un niveau de performance médaillé d'or à l'Olympiade internationale de mathématiques 2025
Naviguer dans des domaines scientifiques complexes
Au-delà des mathématiques et du codage compétitif, Gemini 3 Deep Think excelle désormais également dans de vastes domaines scientifiques tels que la chimie et la physique. Notre mode Deep Think mis à jour affiche des résultats de niveau médaille d'or dans les sections écrites des Olympiades internationales de physique et de chimie 2025. Il démontre également sa maîtrise de la physique théorique avancée, avec un score de 50,5 % sur CMT-Benchmark.
Accélérer l'ingénierie dans le monde réel
En plus de ses performances de pointe, Deep Think est conçu pour favoriser les applications pratiques, permettant aux chercheurs d'interpréter des données complexes et aux ingénieurs de modéliser des systèmes physiques à l'aide de code. Plus important encore, nous nous efforçons de mettre Deep Think à la disposition des chercheurs et des praticiens là où ils en ont le plus besoin, en commençant par des interfaces telles que l'API Gemini.
Source : Annonce de Google
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Trois ans après avoir été pris au dépourvu par ChatGPT, Gemini est-il en train de gagner ? Des benchmarks et des chercheurs suggèrent que Gemini a ce qu'il faut pour détrôner OpenAI et tous ses concurrents
Anthropic lance son dernier modèle d'IA de « vibe working », Claude Opus 4.6, qui est présenté comme plus performant en matière de codage et capable de produire un travail professionnel de meilleure qualité
OpenAI lance GPT-5.3 Codex, qui est 25 % plus rapide que GPT-5.2 et qui a été le premier modèle d'OpenAI à aider à son propre débogage pendant son développement










Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation










Partager