Nous présentons aujourd'hui Gemini 2.5, notre modèle d'IA le plus intelligent. Notre première version 2.5 est une version expérimentale de 2.5 Pro, qui est à la pointe de la technologie sur une large gamme de benchmarks et qui débute à la première place sur LMArena avec une marge significative.
Les modèles Gemini 2.5 sont des modèles de raisonnement, capables de raisonner sur leurs pensées avant de répondre, ce qui se traduit par des performances et une précision accrues.
Dans le domaine de l'IA, la capacité de « raisonnement » d'un système ne se limite pas à la classification et à la prédiction. Il s'agit de sa capacité à analyser les informations, à tirer des conclusions logiques, à intégrer le contexte et les nuances, et à prendre des décisions éclairées.
Depuis longtemps, nous explorons les moyens de rendre l'IA plus intelligente et plus capable de raisonner grâce à des techniques telles que l'apprentissage par renforcement et l'incitation à la réflexion en chaîne. Sur cette base, nous avons récemment présenté notre premier modèle de raisonnement, Gemini 2.0 Flash Thinking.
Aujourd'hui, avec Gemini 2.5, nous avons atteint un nouveau niveau de performance en combinant un modèle de base considérablement amélioré avec un post-entraînement plus performant. À l'avenir, nous intégrerons ces capacités de raisonnement directement dans tous nos modèles, afin qu'ils puissent traiter des problèmes plus complexes et prendre en charge des agents encore plus performants et conscients du contexte.
Présentation de Gemini 2.5 Pro
Gemini 2.5 Pro Experimental est notre modèle le plus avancé pour les tâches complexes. Il arrive en tête du classement LMArena - qui mesure les préférences humaines - avec une marge significative, ce qui indique un modèle très performant doté d'un style de haute qualité. 2.5 Pro présente également de solides capacités de raisonnement et de codage, en tête des tests de codage, de mathématiques et de sciences les plus courants.
Gemini 2.5 Pro est disponible dès maintenant dans Google AI Studio et dans l'application Gemini pour les utilisateurs de Gemini Advanced, et sera bientôt disponible dans Vertex AI. Nous introduirons également une tarification dans les semaines à venir, permettant aux utilisateurs d'utiliser 2.5 Pro avec des limites de taux plus élevées pour une utilisation en production à grande échelle.
Raisonnement amélioré
Gemini 2.5 Pro est à la pointe de la technologie pour toute une série de tests nécessitant un raisonnement avancé. Sans les techniques de temps de test qui augmentent les coûts, comme le vote majoritaire, 2.5 Pro est en tête dans les tests de mathématiques et de sciences comme GPQA et AIME 2025.
Il obtient également un score de pointe de 18,8 % sur l'ensemble des modèles sans utilisation d'outils dans Humanity's Last Exam, un ensemble de données conçu par des centaines d'experts en la matière pour capturer la frontière humaine de la connaissance et du raisonnement.
Codage avancé
Nous nous sommes concentrés sur les performances de codage et, avec Gemini 2.5, nous avons fait un grand bond en avant par rapport à la version 2.0 - avec d'autres améliorations à venir. 2.5 Pro excelle dans la création d'applications web visuellement attrayantes et d'applications de code agentique, ainsi que dans la transformation et l'édition de code. Sur SWE-Bench Verified, le standard de l'industrie pour les évaluations de code agentique, Gemini 2.5 Pro obtient un score de 63,8 % avec une configuration d'agent personnalisée.
Voici un exemple de la façon dont 2.5 Pro peut utiliser ses capacités de raisonnement pour créer un jeu vidéo en produisant le code exécutable à partir d'une simple ligne d'invite.
S'appuyer sur le meilleur de Gemini
Gemini 2.5 s'appuie sur ce qui fait la force des modèles Gemini : la multimodalité native et une longue fenêtre contextuelle. La version 2.5 Pro est livrée dès aujourd'hui avec une fenêtre contextuelle de 1 million de jetons (bientôt 2 millions), avec des performances élevées qui s'améliorent par rapport aux générations précédentes. Il peut comprendre de vastes ensembles de données et traiter des problèmes complexes à partir de différentes sources d'information, y compris le texte, l'audio, les images, la vidéo et même des référentiels de code entiers.
Les développeurs et les entreprises peuvent commencer à expérimenter Gemini 2.5 Pro dans Google AI Studio dès maintenant, et les utilisateurs de Gemini Advanced peuvent le sélectionner dans la liste déroulante des modèles sur les ordinateurs de bureau et les téléphones portables. Il sera disponible sur Vertex AI dans les semaines à venir.
Comme toujours, nous apprécions les commentaires afin de pouvoir continuer à améliorer rapidement les nouvelles capacités impressionnantes de Gemini, dans le but de rendre notre IA plus utile.
Partager