IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Google annonce Gemini 3 ainsi qu'une nouvelle plateforme d'agents appelée « Google Antigravity »


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    386
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 386
    Par défaut Google annonce Gemini 3 ainsi qu'une nouvelle plateforme d'agents appelée « Google Antigravity »
    Google annonce Gemini 3 pour dépasser ses concurrents tels que GPT-5.1 ainsi qu'une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet de coder « à un niveau supérieur, axé sur les tâches »

    Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».

    Gemini (anciennement Bard) est un chatbot et assistant virtuel génératif basé sur l'intelligence artificielle développé par Google. Basé sur le grand modèle de langage (LLM) du même nom, il a été lancé en mars 2023 en réponse à l'essor du ChatGPT d'OpenAI. En mars, Google DeepMind a lancé Gemini 2.5 Pro, citant des avancées majeures dans les capacités de raisonnement et de codage. Gemini 2.5 est un modèle de raisonnement conçu pour résoudre des problèmes de plus en plus complexes. Google affirme que son premier modèle 2.5, Gemini 2.5 Pro Experimental, est le meilleur dans les critères de référence courants par des marges significatives.

    Récemment, Google a lancé son dernier modèle d'intelligence artificielle, Gemini 3, alors que le géant de la recherche s'efforce de suivre le rythme de OpenAI, le créateur de ChatGPT. Le nouveau modèle d'IA permettra aux utilisateurs d'obtenir de meilleures réponses à des questions plus complexes, « afin que vous obteniez ce dont vous avez besoin avec moins de sollicitations », a déclaré Sundar Pichai, PDG d'Alphabet, dans l'un des nombreux articles de blog publiés mardi par Google.

    Gemini 3 sera intégré à l'application Gemini, aux produits de recherche IA de Google AI Mode et AI Overviews, ainsi qu'à ses produits destinés aux entreprises. Le déploiement commence mardi pour certains abonnés et sera étendu à plus grande échelle dans les semaines à venir. Cette annonce intervient environ huit mois après le lancement de Gemini 2.5 par Google et 11 mois après celui de Gemini 2.0. OpenAI, qui a lancé le boom de l'IA générative fin 2022 avec le lancement public de ChatGPT, a présenté GPT-5 en août.

    « Il est incroyable de penser qu'en seulement deux ans, l'IA est passée de la simple lecture de textes et d'images à la lecture de l'ambiance d'une pièce », a écrit Pichai dans l'un des messages publiés. « À partir d'aujourd'hui, nous déployons Gemini à l'échelle de Google. » L'application Gemini compte désormais 650 millions d'utilisateurs actifs par mois et AI Overviews 2 milliards d'utilisateurs mensuels, a indiqué la société. OpenAI a déclaré en août que ChatGPT avait atteint 700 millions d'utilisateurs hebdomadaires.


    Pichai a ajouté que le tout dernier modèle était « conçu pour saisir la profondeur et les nuances » et a déclaré que Gemini 3 était également « beaucoup plus performant pour comprendre le contexte et l'intention derrière votre demande, afin que vous obteniez ce dont vous avez besoin avec moins d'indications ». Les autres modèles d'IA de Google peuvent toujours être utilisés pour des tâches plus simples, a déclaré la société.

    Alphabet et ses rivaux à forte capitalisation dépensent des sommes considérables pour mettre en place l'infrastructure nécessaire au développement de l'IA et créer rapidement davantage de services pour les consommateurs et les entreprises. Dans leurs rapports financiers publiés le mois dernier, Alphabet, Meta, Microsoft et Amazon ont chacun revu à la hausse leurs prévisions en matière de dépenses d'investissement et s'attendent collectivement à ce que ce chiffre atteigne plus de 380 milliards de dollars cette année.

    Google a déclaré que les réponses de l'IA alimentées par Gemini 3 « troqueront les clichés et les flatteries contre des informations authentiques, vous disant ce que vous avez besoin d'entendre, et non ce que vous voulez entendre », selon une déclaration de Demis Hassabis, PDG de DeepMind, la division IA de Google. Les critiques du secteur ont déclaré que les chatbots IA actuels sont trop flagorneurs.

    OpenAI a publié deux mises à jour de GPT-5. L'une est « plus chaleureuse, plus intelligente et plus apte à suivre vos instructions », a déclaré la société, et l'autre est « plus rapide pour les tâches simples, plus persévérante pour les tâches complexes ».

    Google a également annoncé une nouvelle plateforme d'agent appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ». Gemini 3 est le « meilleur modèle de codage vibe jamais créé » par l'entreprise, a déclaré Josh Woodward, vice-président de Google Labs et Gemini, lors d'une conférence de presse. Le vibe codage fait référence à un marché en pleine expansion d'outils permettant aux développeurs de logiciels de générer du code à partir d'invites.

    Google a déclaré que le nouveau modèle permettra la création d'« interfaces génératives », fournissant certaines réponses d'une manière qui ressemble à un magazine numérique. À titre d'exemple, la société a demandé à Gemini d'« expliquer la galerie Van Gogh en donnant le contexte de chaque œuvre ». Le résultat a été une explication colorée et illustrée pour chaque tableau. Dans le mode IA, Gemini 3 sera d'abord disponible pour les abonnés payants. Il sera capable d'analyser une question et de créer une mise en page avec des éléments visuels tels que des images, des tableaux et des grilles. Google a déclaré qu'il pouvait créer un calculateur de prêt interactif sur mesure ou une simulation interactive sur un problème physique complexe.

    Les développeurs pourront accéder à l'API Gemini et les entreprises pourront l'intégrer via Vertex AI, le service cloud de Google conçu pour créer, déployer et gérer des modèles d'IA. Pour les entreprises, Gemini 3 peut notamment créer des programmes d'intégration et de formation pour les employés, analyser plus précisément des vidéos et des images d'usine, et gérer les achats, a déclaré la société.

    Cette annonce rappelle les déclarations de Mo Gawdat, l'ancien directeur commercial de Google X, qui a dressé un tableau sombre de l'avenir de l'intelligence artificielle. Selon lui, l'IA ne se contentera pas de prendre des emplois, mais provoquera une période de « 15 ans d'enfer » qui débutera plus tôt que nous le pensons. Gawdat a mis en garde contre le déplacement massif d'emplois, touchant même des professions que l'on croyait à l'abri... même des fonctions comme PDG. Il a expliqué que les systèmes d'IA de plus en plus sophistiqués seront en mesure de reproduire les compétences humaines de manière plus efficace et à moindre coût, rendant de nombreux postes superflus.

    Nom : 1.jpg
Affichages : 8091
Taille : 19,1 Ko

    Voici la note de Sundar Pichai, PDG de Google et d'Alphabet :

    Il y a près de deux ans, nous avons lancé l'ère Gemini, l'un des plus grands projets scientifiques et produits jamais entrepris par notre entreprise. Depuis lors, nous avons été impressionnés par l'engouement qu'il a suscité. AI Overviews compte désormais 2 milliards d'utilisateurs chaque mois. L'application Gemini dépasse les 650 millions d'utilisateurs par mois, plus de 70 % de nos clients Cloud utilisent notre IA, 13 millions de développeurs ont créé des applications à l'aide de nos modèles génératifs, et ce n'est qu'un aperçu de l'impact que nous constatons.

    Et nous sommes en mesure de mettre à la disposition du monde entier des fonctionnalités avancées plus rapidement que jamais, grâce à notre approche différenciée de l'innovation en matière d'IA, qui couvre l'ensemble de la chaîne, depuis notre infrastructure de pointe jusqu'à nos recherches, modèles et outils de classe mondiale, en passant par des produits qui touchent des milliards de personnes à travers le monde.

    Chaque génération de Gemini s'appuie sur la précédente, vous permettant d'en faire toujours plus. Les avancées de Gemini 1 en matière de multimodalité native et de fenêtre contextuelle longue ont élargi les types d'informations pouvant être traitées, ainsi que leur volume. Gemini 2 a jeté les bases des capacités agentives et repoussé les limites du raisonnement et de la réflexion, facilitant les tâches et les idées plus complexes, ce qui a permis à Gemini 2.5 Pro de dominer LMArena pendant plus de six mois.

    Nous présentons aujourd'hui Gemini 3, notre modèle le plus intelligent, qui combine toutes les capacités de Gemini pour vous permettre de donner vie à n'importe quelle idée.

    Il s'agit d'un modèle de raisonnement de pointe, conçu pour saisir la profondeur et les nuances, qu'il s'agisse de percevoir les indices subtils d'une idée créative ou de démêler les couches superposées d'un problème difficile. Gemini 3 est également beaucoup plus performant pour comprendre le contexte et l'intention derrière votre demande, ce qui vous permet d'obtenir ce dont vous avez besoin avec moins d'indications. Il est étonnant de penser qu'en seulement deux ans, l'IA est passée de la simple lecture de textes et d'images à la lecture de l'atmosphère d'une pièce.

    Et à partir d'aujourd'hui, nous déployons Gemini à l'échelle de Google. Cela inclut Gemini 3 en mode IA dans la recherche, avec un raisonnement plus complexe et de nouvelles expériences dynamiques. C'est la première fois que nous déployons Gemini dans la recherche dès le premier jour. Gemini 3 arrive également aujourd'hui dans l'application Gemini, chez les développeurs dans AI Studio et Vertex AI, ainsi que dans notre nouvelle plateforme de développement agentique, Google Antigravity. Plus d'informations ci-dessous.

    Comme les générations précédentes, Gemini 3 fait une nouvelle fois progresser l'état de l'art. Dans ce nouveau chapitre, nous continuerons à repousser les limites de l'intelligence, des agents et de la personnalisation afin de rendre l'IA vraiment utile pour tous.

    Nous espérons que vous apprécierez Gemini 3. Nous continuerons à l'améliorer et sommes impatients de voir ce que vous créerez avec. Beaucoup d'autres nouveautés sont à venir !



    Présentation de Gemini 3 : un raisonnement avec une profondeur et des nuances

    Gemini 3 Pro peut donner vie à n'importe quelle idée grâce à son raisonnement de pointe et ses capacités multimodales. Il surpasse largement 2.5 Pro dans tous les principaux benchmarks d'IA. Il arrive en tête du classement LMArena avec un score révolutionnaire de 1501 Elo. Il fait preuve d'un raisonnement de niveau doctoral avec les meilleurs scores au Humanity's Last Exam (37,5 % sans utiliser aucun outil) et au GPQA Diamond (91,9 %). Il établit également une nouvelle norme pour les modèles de pointe en mathématiques, atteignant un nouveau record de 23,4 % sur MathArena Apex.

    Au-delà du texte, Gemini 3 Pro redéfinit le raisonnement multimodal avec 81 % sur MMMU-Pro et 87,6 % sur Video-MMMU. Il obtient également un score de pointe de 72,1 % sur SimpleQA Verified, ce qui montre de grands progrès en matière d'exactitude factuelle. Cela signifie que Gemini 3 Pro est très performant pour résoudre des problèmes complexes dans un large éventail de domaines tels que les sciences et les mathématiques, avec un haut degré de fiabilité.

    Nom : 2.jpg
Affichages : 1861
Taille : 82,8 Ko

    Gemini 3 Pro apporte également un nouveau niveau de profondeur et de nuance à chaque interaction. Ses réponses sont intelligentes, concises et directes, troquant les clichés et les flatteries contre une véritable perspicacité — vous disant ce que vous avez besoin d'entendre, et pas seulement ce que vous voulez entendre. Il agit comme un véritable partenaire de réflexion qui vous offre de nouvelles façons de comprendre l'information et de vous exprimer, de la traduction de concepts scientifiques complexes à la génération de code pour des visualisations haute fidélité, en passant par le brainstorming créatif.


    Gemini 3 Deep Think

    Le mode Gemini 3 Deep Think repousse encore plus loin les limites de l'intelligence, en apportant une amélioration radicale aux capacités de raisonnement et de compréhension multimodale de Gemini 3 pour vous aider à résoudre des problèmes encore plus complexes. Lors des tests, Gemini 3 Deep Think surpasse les performances déjà impressionnantes de Gemini 3 Pro au Humanity's Last Exam (41,0 % sans utilisation d'outils) et au GPQA Diamond (93,8 %). Il atteint également un score sans précédent de 45,1 % à l'ARC-AGI-2 (avec exécution de code, ARC Prize Verified), démontrant ainsi sa capacité à résoudre des défis inédits.

    Nom : 3.jpg
Affichages : 1858
Taille : 32,7 Ko

    Apprenez tout ce que vous voulez

    Gemini a été conçu dès le départ pour synthétiser de manière transparente des informations sur n'importe quel sujet à travers plusieurs modalités, notamment le texte, les images, la vidéo, l'audio et le code. Gemini 3 repousse les limites du raisonnement multimodal pour vous aider à apprendre de manière pertinente en combinant son raisonnement, sa vision et sa compréhension spatiale de pointe, ses performances multilingues de premier plan et sa fenêtre contextuelle d'un million de tokens.

    Pour vous aider à mieux comprendre les informations disponibles sur le Web, le mode IA de la recherche utilise désormais Gemini 3 afin d'offrir de nouvelles expériences d'interface utilisateur génératives, telles que des mises en page visuelles immersives, des outils interactifs et des simulations, le tout généré à la volée en fonction de votre requête.

    Construisez tout ce que vous voulez

    S'appuyant sur le succès de 2.5 Pro, Gemini 3 tient sa promesse de donner vie à toutes les idées des développeurs. Il est exceptionnel en matière de génération sans apprentissage et gère des invites et des instructions complexes pour rendre l'interface utilisateur Web plus riche et plus interactive.

    Gemini 3 serait le meilleur modèle de vibe codage et de codage agentique de Google, rendant les produits plus autonomes et stimulant la productivité des développeurs. Il arrive en tête du classement WebDev Arena avec un score impressionnant de 1487 Elo. Il obtient également un score de 54,2 % sur Terminal-Bench 2.0, qui teste la capacité d'un modèle à utiliser des outils pour faire fonctionner un ordinateur via un terminal, et il surpasse largement 2.5 Pro sur SWE-bench Verified (76,2 %), un benchmark qui mesure les agents de codage.

    Vous pouvez désormais créer avec Gemini 3 dans Google AI Studio, Vertex AI, Gemini CLI et notre nouvelle plateforme de développement agentique, Google Antigravity. Il est également disponible sur des plateformes tierces telles que Cursor, GitHub, JetBrains, Manus, Replit et bien d'autres.


    Présentation d'une nouvelle expérience de développement axée sur les agents

    À mesure que l'intelligence des modèles s'accélère avec Gemini 3, nous avons l'opportunité de repenser l'ensemble de l'expérience des développeurs. Google lance Google Antigravity, une nouvelle plateforme de développement agentique qui permet aux développeurs d'opérer à un niveau supérieur, axé sur les tâches.

    Grâce aux capacités avancées de raisonnement, d'utilisation d'outils et de codage agentique de Gemini 3, Google Antigravity transforme l'assistance IA d'un outil dans la boîte à outils d'un développeur en un partenaire actif. Si le cœur de Google Antigravity reste une expérience EDI IA familière, ses agents ont été élevés à un niveau supérieur et bénéficient désormais d'un accès direct à l'éditeur, au terminal et au navigateur. Désormais, les agents peuvent planifier et exécuter de manière autonome des tâches logicielles complexes de bout en bout simultanément pour votre compte, tout en validant leur propre code.

    En plus de Gemini 3 Pro, Google Antigravity est également étroitement associé à notre dernier modèle Gemini 2.5 Computer Use pour le contrôle du navigateur et au modèle d'édition d'images le mieux noté, Nano Banana (Gemini 2.5 Image).

    Planifiez tout

    Depuis l'introduction de l'ère des agents avec Gemini 2, Google a fait beaucoup de progrès, non seulement en améliorant les capacités de codage de Gemini, mais aussi en améliorant sa capacité à planifier de manière fiable à plus long terme. Gemini 3 le démontre en se classant en tête du classement Vending-Bench 2, qui teste la planification à plus long terme en gérant une entreprise de distributeurs automatiques simulée. Gemini 3 Pro maintient une utilisation cohérente des outils et une prise de décision constante pendant une année complète de simulation, générant des rendements plus élevés sans s'écarter de la tâche.

    Nom : 4.jpg
Affichages : 1241
Taille : 39,6 Ko

    Cela signifie que Gemini 3 peut mieux vous aider à accomplir vos tâches quotidiennes. En combinant un raisonnement plus approfondi avec une utilisation améliorée et plus cohérente des outils, Gemini 3 peut agir en votre nom en naviguant dans des flux de travail plus complexes et en plusieurs étapes, du début à la fin, comme la réservation de services locaux ou l'organisation de votre boîte de réception, tout en restant sous votre contrôle et vos instructions.

    Les abonnés à Google AI Ultra peuvent essayer dès aujourd'hui ces fonctionnalités d'agent dans l'application Gemini avec Gemini Agent.


    Sources : Google, Google Antigravity

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Google publie des versions mises à jour de ses modèles d'IA Gemini 2.5 Flash et 2.5 Flash-Lite, avec un meilleur suivi des instructions complexes et des capacités multimodales renforcées

    L'IA Gemini s'intègre désormais profondément à Chrome et peut lire vos onglets, consulter votre historique de navigation, ainsi que s'interfacer avec YouTube et d'autres services Google

    Google Gemini a du mal à écrire du code, se qualifie lui-même de « honte pour son espèce » et confirme une tendance faite de doute autour des performances réelles de l'intelligence artificielle
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Chroniqueur Actualités
    Avatar de Anthony
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Novembre 2022
    Messages
    1 946
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Novembre 2022
    Messages : 1 946
    Par défaut Google lance Nano Banana Pro, un générateur d'images par IA mis à jour et alimenté par Gemini 3
    Google lance Nano Banana Pro, un générateur d'images par IA mis à jour et alimenté par Gemini 3 : « Il est incroyable pour les infographies », déclare Josh Woodward, vice-président de Google Labs et Gemini

    Google a lancé Nano Banana Pro, un nouveau générateur d'images basé sur son modèle d'intelligence artificielle (IA) Gemini 3, soulignant ainsi l'accélération des efforts de l'entreprise dans le domaine des outils multimédias génératifs. Cette mise à jour améliore la précision de la conception, le rendu multilingue du texte et la cohérence des caractères, élargissant ainsi les capacités de la plateforme au-delà de son prédécesseur. Ce lancement intervient alors que Google intensifie sa concurrence avec OpenAI, dans un contexte de demande croissante des utilisateurs et d'engagement poussé dans son écosystème d'IA.

    Le jeudi 20 novembre, Google a lancé Nano Banana Pro, son tout dernier outil d'édition et de génération d'images par intelligence artificielle (IA), poursuivant ainsi sur sa lancée après le lancement de son nouveau modèle Gemini 3, conçu pour surpasser ses concurrents, comme GPT-5.1. Lancée huit mois après Gemini 2.5, la nouvelle génération de modèles Gemini promet des interactions nécessitant moins d’indications, tandis que la plateforme d’agents Antigravity introduit une approche de développement orientée tâches.

    Dans le même élan, Google avait déjà renforcé l'application Gemini avec le modèle d'IA Nano Banana afin d'améliorer ses capacités d'édition d'images. Cette mise à jour, axée sur le traitement avancé des photos, a été décrite par certains observateurs comme susceptible de faire de l'ombre à des solutions établies telles que Photoshop, illustrant ainsi l'ambition croissante de Google dans le domaine des usages créatifs de l'IA.

    Josh Woodward, vice-président de Google Labs et Gemini, a déclaré que les capacités de Nano Banana Pro allaient au-delà de sa version initiale, lancée fin août. « Il est incroyable pour créer des infographies. Il peut créer des présentations PowerPoint. Il peut prendre jusqu'à 14 images différentes, ou cinq caractères différents, et conserver en quelque sorte la cohérence de ces caractères », a-t-il déclaré.


    Il a ajouté que les utilisateurs internes ont testé cette fonctionnalité en saisissant des extraits de code et même des CV LinkedIn pour créer des infographies. « Je pense que cette capacité à visualiser des choses qui, auparavant, n'étaient peut-être pas considérées comme un support visuel, est l'un des aspects magiques que les gens découvrent avec cet outil », a déclaré Josh Woodward.

    La version originale de Nano Banana est devenue virale sur les réseaux sociaux lorsque les utilisateurs ont transformé des photos d'eux-mêmes ou de leurs animaux de compagnie en figurines 3D hyperréalistes. Josh Woodward a écrit dans un post X en septembre que le produit avait contribué à ajouter 13 millions de nouveaux utilisateurs à l'application Gemini en l'espace de quatre jours.

    Nano Banana Pro, qui est basé sur Gemini 3 Pro, a contribué à des records historiques du cours de l'action. Le 20 novembre, l'action d'Alphabet a augmenté de 4 %.

    Créer un flux de travail créatif complet

    Selon Google, Nano Banana Pro excelle dans la conception visuelle, la connaissance du monde et la génération de texte, ce qui permet aux entreprises de :

    • Déployer plus rapidement des campagnes mondiales localisées. Le modèle prend en charge le rendu de texte dans plusieurs langues. Les utilisateurs peuvent même prendre une image et traduire le texte qu'elle contient, afin que leur travail créatif soit immédiatement prêt pour d'autres pays.
    • Créer des ressources visuelles plus précises et riches en contexte. Nano Banana Pro étant connecté à Google Search, il comprend le contexte du monde réel. Les utilisateurs peuvent ainsi générer des cartes, des diagrammes et des infographies qui reflètent fidèlement les faits et les détails, ce qui est idéal pour les manuels de formation ou les guides techniques où la précision est essentielle.
    • Conserver un contrôle créatif plus fort et une fidélité à la marque. Selon Google, le maintien de la cohérence de la marque, du produit ou du personnage est souvent le plus grand défi lorsque l'on utilise l'IA pour les ressources créatives. Nano Banana Pro permet à une équipe créative de garder le contrôle grâce à sa fenêtre de contexte visuel étendue. Cela peut être considéré comme une « suggestion en quelques clics » pour les designers : en permettant aux utilisateurs de télécharger jusqu'à 14 images de référence, ils peuvent désormais charger simultanément un guide de style complet, comprenant les logos, les palettes de couleurs, les rotations de personnages et les photos de produits. Cela garantit que le modèle dispose du contexte complet nécessaire pour correspondre à l'identité d'une marque. Si l'utilisateur a besoin d'affiner le résultat, il lui suffit de décrire le changement en utilisant un langage naturel pour ajouter, supprimer ou remplacer des détails. Nano Banana Pro prend en charge des images jusqu'à 4K pour un niveau de détail et une netteté supérieurs sur plusieurs formats d'image.

    Nano Banana Pro et Nano Banana sont ainsi conçus pour alimenter un flux de travail créatif complet. Les utilisateurs peuvent commencer avec Nano Banana pour une conceptualisation rapide, puis passez à Nano Banana Pro lorsqu'ils ont besoin d'une fidélité maximale pour des ressources prêtes à la production.


    Cas d'utilisation

    Répondre aux besoins commerciaux : les deux modèles Nano Banana et Nano Banana Pro s'inscrivent dans le cadre de responsabilité partagée de Google, et ils permettent aux utilisateurs de garantir la transparence et une utilisation responsable grâce au filigrane SynthID intégré à chaque ressource générée. Google s'est engagé à répondre aux besoins commerciaux des utilisateurs avec une indemnisation des droits d'auteur dès la mise à disposition générale.

    Nom : nano banana pro fig 1.PNG
Affichages : 7082
Taille : 159,1 Ko
    Prompt : Traduis tout le texte en anglais figurant sur les trois boîtes jaunes et bleues en coréen, sans modifier le reste.

    Recherche approfondie : Nano Banana Pro peut utiliser Google Search pour effectuer des recherches sur des sujets en fonction de la requête des utilisateurs et déterminer comment présenter des informations factuelles et fondées.

    Nom : nano banana pro fig 2.PNG
Affichages : 1592
Taille : 286,3 Ko
    Prompt : Crée une infographie qui montre comment préparer un elaichi chai.

    Composition avancée : Les utilisateurs peuvent ajouter jusqu'à 14 images de référence pour combiner des éléments, mélanger des scènes et transférer des designs afin de créer quelque chose d'entièrement nouveau. Nano Banana Pro conserve la qualité d'un élément développé, mais le fournit en quelques minutes.

    Nom : nano banana pro fig 3.PNG
Affichages : 1557
Taille : 451,4 Ko
    Prompt : Photo de style éditorial, mannequin féminin portant un jean, un haut jaune à pois, un bandeau, des talons rouges et un sac noir au bras. Elle tient un matcha latte glacé dans une main et, dans l'autre, la laisse d'un chien chow-chow. Elle se tient devant une maison à Beverly Hills et regarde l'appareil photo. Respecte l'esthétique générale et la palette de couleurs de la photo avec la maison. Il y a un logo blanc « Love Letters » avec une ombre à 10 % d'opacité dans le coin inférieur gauche.

    Rendu de texte avancé : Les utilisateurs peuvent générer du texte clair et précis dans les images, ouvrant ainsi la voie à des cas d'utilisation pour les maquettes de produits, les affiches et les schémas pédagogiques. Cela peut inclure le placement naturel du texte (par exemple, le texte s'enroulant autour d'un objet) et la prise en charge de diverses polices et styles.

    Nom : nano banana pro fig 4.PNG
Affichages : 1545
Taille : 446,6 Ko
    Prompt : Crée une image représentant la phrase « Combien de bois une marmotte pourrait-elle couper si une marmotte pouvait couper du bois » à partir de bois coupé par une marmotte.

    Intensification de la concurrence avec ChatGPT d'OpenAI

    La sortie de Nano Banana Pro intervient alors que Google s'efforce de gagner du terrain sur OpenAI dans la course à l'IA générative, qui s'est déclenchée après la sortie de ChatGPT en 2022.

    La semaine dernière, OpenAI a annoncé deux mises à jour de son modèle GPT-5 afin de le rendre « plus chaleureux par défaut et plus conversationnel », ainsi que « plus efficace et plus facile à comprendre dans son utilisation quotidienne », a déclaré la société. ChatGPT est actuellement en tête de la liste des applications gratuites sur l'App Store d'Apple, suivi de Gemini en deuxième position.

    L'application Gemini compte à ce jour plus de 650 millions d'utilisateurs actifs par mois, et la fonctionnalité AI Overviews alimentée par Gemini compte 2 milliards d'utilisateurs par mois, a déclaré Google dans un communiqué. Le PDG d'OpenAI, Sam Altman, a déclaré en octobre que ChatGPT avait atteint 800 millions d'utilisateurs actifs par semaine.

    Forte demande pour les outils Gemini

    Josh Woodward a déclaré que les produits d'IA de Google connaissaient une demande croissante, de nombreux utilisateurs s'abonnant au plan d'abonnement de Gemini pour bénéficier de « limites plus élevées avec certains de ces modèles avancés ». « Nous constatons qu'un grand nombre de personnes s'intéressent à ces produits », a-t-il déclaré. « C'est vraiment le meilleur problème que l'on puisse avoir : il y a une forte demande, et nous essayons de trouver comment y répondre. »

    La société souhaite continuer à développer ses offres en matière d'IA, a déclaré Josh Woodward, en mettant en avant Flow, l'outil de réalisation de films basé sur l'IA de Google, et Genie, un modèle de « création de mondes » actuellement disponible en avant-première dans le cadre d'un aperçu de recherche.

    Google a également introduit une autre fonctionnalité dans l'application Gemini qui permet aux utilisateurs de télécharger n'importe quelle image pour savoir si elle a été générée par l'IA de Google. Les images générées sur les comptes Nano Banana gratuits comporteront un filigrane, mais celui-ci sera supprimé pour les abonnés Google AI Ultra.

    Disponibilité

    Nano Banana Pro est actuellement disponible dans l'application Gemini avec des quotas gratuits limités, dans l'assistant de rédaction de Google, NotebookLM, ainsi que dans les produits destinés aux développeurs, aux entreprises et à la publicité de la société. Les abonnés à Google AI Pro et Ultra auront accès au produit dans les fonctionnalités de recherche Mode IA de Google. La fonctionnalité sera ensuite déployée en priorité pour les abonnés Ultra dans Flow, l'outil de création cinématographique basé sur l'IA de Google.

    Les développeurs peuvent commencer à créer avec Nano Banana Pro dans l'API Gemini dans Vertex AI. Pour ceux qui développent avec Vertex AI, Nano Banana Pro est une offre de niveau entreprise qui inclut un débit provisionné, un paiement à l'utilisation et des filtres de sécurité avancés. Pour les équipes commerciales, Nano Banana est déjà disponible dans Gemini Enterprise et Nano Banana Pro le sera bientôt. Nano Banana Pro est d'ores et déjà accessible aux clients Google Workspace depuis Google Slides, Vids, l'application Gemini et NotebookLM.

    Source : Google

    Et vous ?

    Quel est votre avis sur le sujet ?
    Trouvez-vous cette initiative de Google crédible ou pertinente ?

    Voir aussi :

    Google va commencer à étiqueter les images générées par l'IA dans ses résultats de recherche, car plus de 70 % des consommateurs craignent d'être dupés par des IA

    Vous pouvez désormais demander à Google Photos de modifier des images à votre place, en décrivant les changements au modèle d'IA Gemini à l'aide de la saisie vocale ou d'un texte

    Google Photos ajoute des outils d'IA pour animer les photos dans différents styles, transformant les photos en vidéos ou en interprétations visuelles uniques

    Les outils IA populaires de générations d'images peuvent être incités à produire des photos identifiables de personnes réelles, menaçant potentiellement leur vie privée
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #3
    Membre éprouvé
    Profil pro
    programmeur du dimanche
    Inscrit en
    Novembre 2003
    Messages
    1 060
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : programmeur du dimanche
    Secteur : Santé

    Informations forums :
    Inscription : Novembre 2003
    Messages : 1 060
    Par défaut
    Si c'est si bon que sur la démo, je plains les infographistes.

  4. #4
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    386
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 386
    Par défaut Geoffrey Hinton, le « parrain de l'IA », affirme que Google « commence à dépasser » OpenAI
    Geoffrey Hinton, le « parrain de l'IA », affirme que Google « commence à dépasser » OpenAI : « Je pense que Google va gagner ».

    Geoffrey Hinton, le « parrain de l'IA », a récemment estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA). Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

    En novembre, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».

    À la suite de cette annonce, Geoffrey Hinton, le « parrain de l'IA », a récemment estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA). Hinton, professeur émérite à l'université de Toronto et ancien expert de Google Brain, s'est également dit surpris que Google ait mis autant de temps à dépasser ses concurrents. Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

    Cette déclaration fait suite au lancement très apprécié de Gemini 3 de Google, une mise à jour qui, selon de nombreux acteurs du monde technologique, a permis à l'entreprise de dépasser le GPT-5 d'OpenAI. Le modèle d'image Nano Banana Pro AI de Google a également connu un grand succès. Ce changement intervient trois ans après que Google aurait déclaré « code rouge » à la suite de la sortie initiale de ChatGPT, des rapports récents suggérant désormais que c'est OpenAI qui pourrait tirer la sonnette d'alarme.

    Geoffrey Hinton affirme que Google dispose d'un avantage en matière de puces IA. Outre le lancement réussi de son tout dernier modèle d'IA, le cours de l'action Google a augmenté après que des rapports ont suggéré que l'entreprise pourrait conclure un accord d'un milliard de dollars pour fournir à Meta, la société mère de Facebook, ses propres puces IA. La création de ses propres puces est un « avantage considérable » pour Google, a fait remarquer Hinton. Il a déclaré : « Google dispose de nombreux chercheurs très compétents et, bien sûr, d'une grande quantité de données et de nombreux centres de données. Je pense que Google va gagner. »


    Hinton, qui a contribué au développement des premières recherches en IA lorsqu'il travaillait chez Google Brain, a déclaré que la société de recherche était autrefois leader dans le domaine de l'IA, mais qu'elle avait choisi de se retenir. « Google a longtemps été en tête, n'est-ce pas ? Google a inventé les transformateurs. Google disposait de chatbots performants avant tout le monde », a souligné Hinton.

    Cependant, Google s'est montré prudent après l'échec en 2016 du lancement par Microsoft de son chatbot IA « Tay », qui a connu une existence éphémère, la société ayant décidé de le fermer après qu'il ait publié des tweets extrêmement racistes, a expliqué Hinton. « Google, qui jouissait évidemment d'une très bonne réputation, craignait de la voir ternie de cette manière », a ajouté Hinton.

    Google a connu quelques lancements de produits difficiles par le passé. L'année dernière, il a dû arrêter son générateur d'images IA parce que les gens disaient qu'il créait des images historiquement incorrectes de personnes de couleur et qualifiaient les résultats de « trop politiquement corrects ». Les versions précédentes de son outil de recherche IA donnaient également des conseils étranges, comme dire aux utilisateurs de mettre de la colle sur leur pizza pour empêcher le fromage de glisser.

    Auparavant, le PDG de l'entreprise, Sundar Pichai, avait même déclaré que l'entreprise avait attendu pour lancer son chatbot parce qu'il n'était pas prêt. « Nous n'avions pas encore atteint un niveau où nous pouvions le commercialiser et où les gens auraient accepté que Google lance ce produit. Il présentait encore beaucoup de problèmes à l'époque », a déclaré Pichai.

    Google fait également un don de 10 millions de dollars canadiens pour aider à financer la chaire Hinton en intelligence artificielle à l'université de Toronto, et l'université versera une somme équivalente. Hinton, qui a quitté Google en 2023 en raison de ses inquiétudes concernant les risques liés à l'IA, s'est depuis exprimé publiquement sur les dangers tels que la perte d'emplois et le fait que l'IA pourrait dépasser l'intelligence humaine. En 2024, il a même reçu le prix Nobel de physique.

    Dans un communiqué, l'entreprise a déclaré : « Les travaux de Geoff sur les réseaux neuronaux, menés pendant ses années universitaires et sa décennie chez Google, ont jeté les bases de l'IA moderne. Cette chaire rend hommage à son héritage et aidera l'université à recruter des chercheurs visionnaires qui se consacreront au même type de recherche fondamentale motivée par la curiosité que Geoff a défendue. »

    Les déclarations de Hinton interviennent alors qu'un rapport a récemment révélé qu'OpenAI aurait besoin de lever au moins 207 milliards de dollars d’ici 2030 pour poursuivre sa trajectoire actuelle, selon des projections de l'équipe américaine de HSBC chargée des logiciels et des services, relayées dans la presse économique. À l’échelle du secteur technologique, ce chiffre frôle l’irréel. Pourtant, il reflète une réalité devenue incontournable : l’intelligence artificielle moderne coûte une fortune monumentale, et chaque nouveau palier technologique transforme cette facture en précipice.

    Source : Interview de Geoffrey Hinton accordée à Business Insider

    Et vous ?

    Pensez-vous que ces déclarations sont crédibles ou pertinentes ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Geoffrey Hinton, parrain de l'IA, affirme que les géants de la technologie ne peuvent tirer profit de leurs investissements astronomiques que si la main-d'œuvre humaine est remplacée

    Les actions Nvidia chutent de 4 % après l'annonce que Meta utilisera les unités de traitement de tenseur (TPU) de Google, une puce spécialisée hautement efficace pour l'IA, dans ses centres de données en 2027

    L'avance d'OpenAI sur les autres entreprises d'IA a largement disparu après la sortie de Claude d'Anthropic, Gemini de Google, Grok de X, ainsi que Llama de Meta, selon un rapport sur l'état de l'IA
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  5. #5
    Membre extrêmement actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2017
    Messages
    2 488
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2017
    Messages : 2 488
    Par défaut
    Pas besoin d'écouter l'avis de l'auto-proclamé "parrain de l'IA"... Il est bien plus utile d'écouter les "insiders" de l'entreprise...

    OpenAi a changé ses priorités à l'interne et son CEO Altmann a mis l'entreprise en mode "panique": Il a lui même exigé d'arrêter tous les programmes annexes pour que le 100% des employés de l'entreprise se concentre sur le ChatGPT de base pour rattraper l'avance de Google!!!

  6. #6
    Membre éprouvé Avatar de kain_tn
    Homme Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 910
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 910
    Par défaut
    Citation Envoyé par Alex Voir le message
    Geoffrey Hinton, le « parrain de l'IA », affirme que Google « commence à dépasser » OpenAI : « Je pense que Google va gagner ».
    Gagner quoi? Détruire la planète et les ressources plus vite que OpenIA??

  7. #7
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 605
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 605
    Par défaut Google lance Gemini 3 Deep Think : L'IA haut de gamme pour le raisonnement avancé
    Google lance Gemini 3 Deep Think, l'IA haut de gamme pour le raisonnement avancé, exclusivement pour les abonnés à son service premium Google AI Ultra

    Gemini 3 Deep Think de Google est un mode d'IA exclusif pour les abonnés Premium, qui améliore le raisonnement pour les tâches mathématiques, scientifiques et logiques complexes grâce à une décomposition méthodique, à des hypothèses parallèles et à l'auto-vérification. Il surpasse les références et s'adresse aux professionnels, positionnant Google à la pointe de l'innovation en matière d'IA avancée.

    Gemini, anciennement Bard, est un assistant conversationnel développé par Google. Pour générer du texte, il se base sur une famille de grands modèles de langage également appelée Gemini, introduite au public le 7 décembre 2023. Gemini est l'acronyme de Generalized Multimodal Intelligence Network. Les modèles se déclinent en trois tailles: nano, pro et ultra. Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues).

    En novembre, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».

    La dernière avancée de Google en matière d'intelligence artificielle (IA) est arrivée, promettant de transformer la manière dont les utilisateurs abordent les problèmes complexes. L'entreprise a lancé Gemini 3 Deep Think, un mode amélioré dans son application Gemini, exclusivement pour les abonnés à son service premium Google AI Ultra. Cette fonctionnalité s'appuie sur le modèle fondamental Gemini 3 et vise à offrir des capacités de raisonnement supérieures pour les tâches complexes en mathématiques, en sciences et en logique. Les modèles d'IA évoluant rapidement, cette mise à jour positionne Google à l'avant-garde d'un domaine concurrentiel où la profondeur de la réflexion prime de plus en plus sur la vitesse pure.

    À la base, Gemini 3 Deep Think est conçu pour relever des défis à multiples facettes qui exigent une réflexion prolongée. Contrairement aux réponses standard de l'IA qui privilégient les résultats rapides, ce mode utilise une approche méthodique, décomposant les problèmes en éléments plus petits, évaluant plusieurs hypothèses en parallèle et vérifiant les conclusions de manière autonome. Google décrit ce mode comme les « capacités de raisonnement les plus puissantes à ce jour », selon les annonces du PDG Sundar Pichai. Le déploiement fait suite à un aperçu le mois dernier lors du lancement de la série Gemini 3, et il est maintenant accessible via l'application Gemini sur les appareils mobiles.

    Pour les professionnels de l'industrie, les implications sont profondes. Les développeurs, les chercheurs et les analystes qui s'appuient sur l'IA pour des simulations avancées ou des analyses de données peuvent désormais utiliser un outil qui imite le raisonnement humain. Les premiers utilisateurs font état d'améliorations significatives dans la résolution de problèmes qui échappent même aux modèles les plus sophistiqués, tels que les dilemmes de codage avancés ou la modélisation scientifique. Il ne s'agit pas d'une simple mise à jour incrémentale, mais d'une démarche stratégique de Google pour différencier ses offres sur un marché encombré de concurrents dans le domaine de l'IA.


    Hypothèses parallèles et auto-vérification : Les mécanismes de Deep Think

    La technologie qui sous-tend Gemini 3 Deep Think s'appuie sur les avancées les plus récentes en matière d'architecture de l'IA. Elle intègre un raisonnement multimodal de pointe, qui permet au modèle de traiter simultanément du texte, des images et du code. Selon les détails partagés par Google DeepMind, Gemini 3 dispose d'une fenêtre contextuelle d'un million de jetons, ce qui lui permet de traiter de grandes quantités d'informations sans perdre le fil des détails. Cette capacité est cruciale pour les tâches nécessitant une connaissance approfondie du contexte ou un raffinement itératif.

    Les performances des tests de référence soulignent ses prouesses. Sur le benchmark de raisonnement ARC-AGI-2, Gemini 3 Deep Think a obtenu les meilleurs résultats, surpassant les précédents leaders dans les tests de logique et de résolution de problèmes. Selon un rapport, sa conception pour « des problèmes complexes de mathématiques, de sciences et de logique défient même les modèles de pointe les plus avancés ». Il ne s'agit pas d'un simple battage publicitaire : des évaluations indépendantes confirment son avantage dans des scénarios impliquant des simulations en 3D et des tâches analytiques.

    Les abonnés accèdent à ce mode en sélectionnant « Deep Think » dans l'application Gemini, mais il est limité par le plan Google AI Ultra, qui coûte environ 250 dollars par mois pour les utilisateurs individuels. Cette stratégie tarifaire vise les utilisateurs haut de gamme, tels que les entreprises et les chercheurs sérieux, plutôt que les consommateurs occasionnels. Des développeurs et des passionnés de technologie ont exprimé leur enthousiasme, et nombre d'entre eux font état d'une augmentation drastique des quotas pour les abonnés non professionnels, ce qui permet une utilisation plus étendue sans atteindre les limites fixées.

    Si l'on examine plus en détail les critères de référence, on constate que Gemini 3 Deep Think se classe en tête du classement ARC-AGI-2 pour les tâches qui testent le raisonnement abstrait et la généralisation. Ce modèle surpasse les modèles précédents en évaluant des hypothèses en parallèle, une technique qui reflète les processus cognitifs humains. Les quotas d'utilisateurs ont été considérablement augmentés ce qui permet aux abonnés Ultra d'expérimenter à grande échelle sans interruption.

    Techniquement, le modèle utilise un vaste ensemble de paramètres optimisés pour l'efficacité, avec des limites de sortie allant jusqu'à 64k tokens pour des réponses détaillées. Le prix de l'accès à l'API, tel que partagé sur X, commence à 2 dollars par million de jetons pour les petites entrées, et augmente pour les plus grandes, ce qui le rend viable pour les opérations à l'échelle de l'entreprise.

    De l'aperçu au lancement : calendrier et avantages pour les abonnés

    Le voyage vers cette version a commencé avec le lancement de Gemini 3 Pro à la fin du mois de novembre. Ce lancement initial a mis l'accent sur les capacités multimodales et les comportements agentiques, préparant le terrain pour des modes spécialisés tels que Deep Think. À la suite d'évaluations de sécurité, la fonction a été mise en service pour les abonnés Ultra, Google confirmant la disponibilité générale par le biais de divers canaux.

    Les observateurs du secteur soulignent que cette exclusivité s'inscrit dans la stratégie plus large de Google visant à monétiser l'IA avancée. Le mode est maintenant déployé après une période de prévisualisation, améliorant ainsi la proposition de valeur pour les utilisateurs payants. Pour les utilisateurs de niveaux inférieurs, comme Google AI Pro, l'accès reste limité, bien que certains pensent que les extensions futures pourraient inclure des demandes quotidiennes plafonnées.

    Les réactions des premiers utilisateurs révèlent un mélange d'enthousiasme et d'appels à un accès plus large. Un retour soulignait la capacité du modèle à s'attaquer à des « problèmes ambitieux » grâce à la pensée parallèle, tandis qu'un autre déplorait qu'il soit réservé aux abonnés Ultra. Ce sentiment fait écho à des conversations plus larges dans la communauté technologique sur la démocratisation d'outils d'IA puissants par rapport à la préservation des fonctions premium pour les revenus.

    Voici l'annonce de Google :

    Aujourd'hui, nous lançons le mode Deep Think de Gemini 3 pour les abonnés de Google AI Ultra dans l'application Gemini. Ce nouveau mode offre une amélioration significative des capacités de raisonnement, conçues pour résoudre des problèmes mathématiques, scientifiques et logiques complexes qui mettent à l'épreuve même les modèles de pointe les plus avancés.

    Gemini 3 Deep Think est leader sur des benchmarks rigoureux tels que Humanity's Last Exam (41,0 % sans l'utilisation d'outils) et ARC-AGI-2 (un taux sans précédent de 45,1 % avec l'exécution de code). En effet, il utilise un raisonnement parallèle avancé pour explorer plusieurs hypothèses simultanément, en s'appuyant sur les variantes de Gemini 2.5 Deep Think qui ont récemment obtenu une médaille d'or à l'Olympiade internationale de mathématiques et aux finales mondiales de l'International Collegiate Programming Contest.

    Les abonnés Ultra peuvent essayer le mode Deep Think de Gemini 3 dès aujourd'hui en sélectionnant « Deep Think » dans la barre d'invite et Gemini 3 Pro dans le menu déroulant du modèle.
    Nom : 1.jpg
Affichages : 17081
Taille : 28,1 Ko

    Avantages concurrentiels et défis liés à l'IA avancée

    Dans un domaine qui regorge d'innovations en matière d'IA, Gemini 3 Deep Think se distingue en mettant l'accent sur un raisonnement délibéré, étape par étape, plutôt que sur des réponses rapides. Les offres de concurrents comme OpenAI se concentrent souvent sur la fluidité de la conversation, mais l'approche de Google s'adresse à des domaines exigeant précision et profondeur. Par exemple, dans les tâches de codage et d'agentisme, le modèle améliore de 30 % l'efficacité de l'utilisation des outils.

    L'intégration à l'écosystème de Google ajoute un attrait supplémentaire. Les utilisateurs peuvent incorporer Deep Think de manière transparente dans les flux de travail impliquant Google Cloud ou Vertex AI, comme l'a indiqué Thomas Kurian, PDG de Google Cloud. Cette connectivité est particulièrement précieuse pour les entreprises. Cette connectivité est particulièrement précieuse pour les entreprises qui créent des applications personnalisées ou mènent des recherches. En outre, le fait que les connaissances du modèle soient arrêtées en janvier 2025 garantit qu'il dispose d'informations actualisées, ce qui réduit le risque de réponses périmées dans des domaines en évolution rapide.

    Si les capacités sont impressionnantes, le déploiement d'outils de raisonnement aussi puissants soulève des questions quant à leur utilisation abusive et à leur déploiement éthique. Google a effectué des tests de sécurité avant la mise sur le marché, mais les initiés de l'industrie s'inquiètent des biais potentiels dans l'évaluation parallèle des hypothèses. Le mécanisme d'auto-vérification permet d'atténuer les erreurs, mais ne les élimine pas complètement.

    L'accessibilité reste un point d'achoppement. Compte tenu du coût élevé de l'abonnement, Deep Think est hors de portée de nombreux développeurs indépendants et petites entreprises. Les messages sur les réseaux sociaux reflètent la frustration des utilisateurs, qui réclament un accès échelonné ou des essais gratuits afin de favoriser l'innovation au sein d'une base d'utilisateurs plus large.

    D'un point de vue positif, l'accent mis par le mode sur les tâches complexes pourrait accélérer les percées dans des domaines tels que les simulations de soins de santé ou la modélisation climatique, où l'analyse approfondie est primordiale. Il s'agit d'une étape vers des agents d'intelligence artificielle « pensants » qui vont au-delà des interactions basées sur le chat.

    Applications dans le monde réel : Études de cas et expériences des utilisateurs

    Des applications pratiques apparaissent déjà. Dans le domaine du développement de logiciels, les programmeurs utilisent Deep Think pour déboguer des bases de code complexes, en tirant parti de sa capacité à simuler plusieurs scénarios simultanément. Un utilisateur l'a décrit comme un « super-raisonneur » pour les problèmes de logique à plusieurs étapes, idéal pour la recherche et le prototypage.

    Dans les domaines scientifiques, le mode excelle à analyser des ensembles de données et à générer des hypothèses. Par exemple, il peut modéliser des réactions chimiques ou prédire les résultats d'expériences de physique avec une grande précision. Des publications expliquent en détail comment ce mode est adapté à des tâches exigeantes et n'est accessible qu'aux abonnés après des tests rigoureux.

    Les éducateurs et les étudiants inscrits à des programmes avancés pourraient en bénéficier indirectement, bien que les restrictions actuelles les limitent. Google a déjà offert un accès gratuit aux modèles pour les étudiants de certaines régions, ce qui laisse présager d'éventuelles extensions futures.

    Le déploiement s'étend à l'échelle mondiale, avec la prise en charge de plusieurs langues, ce qui renforce son utilité sur divers marchés. Sundar Pichai a mis l'accent sur la force de raisonnement de l'application pour les utilisateurs internationaux. Dans des régions comme l'Inde, où l'adoption de l'IA est en plein essor, de telles fonctionnalités pourraient stimuler les efforts en matière d'éducation et de recherche. Le traitement multilingue permet un traitement nuancé des requêtes en langue autre que l'anglais, ce qui élargit l'intérêt de l'application.

    Trajectoires futures : Horizons d'expansion et d'innovation

    À l'avenir, Google prévoit d'itérer sur Deep Think, en l'intégrant éventuellement à d'autres outils et en élargissant sa disponibilité. L'expérience de l'entreprise en matière d'extension des fonctionnalités suggère que des éléments de ce mode pourraient être progressivement mis à la disposition des utilisateurs gratuits, ce qui permettrait d'équilibrer l'innovation et l'accessibilité. L'écosystème dans son ensemble bénéficie de ces innovations, qui favorisent un cycle d'amélioration dans lequel les données des utilisateurs affinent les modèles futurs.

    Alors que ses concurrents font progresser leurs modèles de raisonnement, Google doit continuer à investir dans les benchmarks et les performances réelles. En fin de compte, cette version marque une évolution vers une IA qui ne se contente pas de répondre aux questions, mais qui s'y intéresse de près. Pour les leaders de l'industrie, c'est un outil qui pourrait redéfinir la productivité dans les secteurs à forte intensité de connaissances.

    Pour les investisseurs et les entreprises technologiques, Gemini 3 Deep Think représente une étape importante en matière de monétisation. L'offensive de Google dans le domaine des services d'IA haut de gamme pourrait influencer la performance des actions, car les fonctionnalités avancées stimulent la croissance des abonnements. Les partenariats avec les entreprises utilisant Vertex AI pourraient accélérer l'adoption, créant ainsi de nouvelles sources de revenus. Vertex AI fait partie d'une suite destinée à aider les utilisateurs à « apprendre, construire et planifier n'importe quoi ».

    L'interface de l'application Gemini pour Deep Think est intuitive, avec des options permettant de basculer d'un mode à l'autre en toute transparence. Ce choix de conception abaisse la barrière pour les utilisateurs experts tout en conservant une certaine sophistication. L'intégration avec d'autres services Google, tels que Docs ou Sheets, pourrait être envisagée, afin d'améliorer les outils de productivité. Les discussions sur le X spéculent sur des extensions d'API pour des intégrations personnalisées.

    Cette annonce de Google intervient alors que Geoffrey Hinton, le « parrain de l'IA », a récemment estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA). Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

    À mesure que l'IA s'intègre dans les flux de travail quotidiens, de telles fonctionnalités ouvrent la voie à une collaboration hybride entre l'homme et l'IA. Pourtant, au cours d'une interview qui fait l'effet d'une bombe, Mo Gawdat, l'ancien directeur commercial de Google X, a dressé un tableau sombre de l'avenir de l'intelligence artificielle. Selon lui, l'IA ne se contentera pas de prendre des emplois, mais provoquera une période de « 15 ans d'enfer » qui débutera plus tôt que nous le pensons. Gawdat a mis en garde contre le déplacement massif d'emplois, touchant même des professions que l'on croyait à l'abri... même des fonctions comme PDG. Il a expliqué que les systèmes d'IA de plus en plus sophistiqués seront en mesure de reproduire les compétences humaines de manière plus efficace et à moindre coût, rendant de nombreux postes superflus.

    Source : Annonce de Google

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Présenté en avant-première lors de la conférence I/O 2025, Google déploie désormais le mode Deep Think de Gemini 2.5 pour les abonnés AI Ultra, qui repousserait les limites des capacités de réflexion

    Google présente l'abonnement unique Google AI Ultra pour profiter du meilleur de Google AI, proposant les limites d'utilisation les plus élevées et l'accès aux meilleurs modèles d'IA de Google

    Une étude d'Apple remet en question les progrès en «raisonnement» IA vantés par OpenAI, Google et Anthropic : leurs LRM subissent un « effondrement complet de leur précision » face à des problèmes complexes
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  8. #8
    Membre éprouvé Avatar de kain_tn
    Homme Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 910
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 910
    Par défaut
    Citation Envoyé par Jade Emy Voir le message
    [...]En novembre, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».[...]

    Quel est votre avis sur le sujet ?
    Ah oui, "Antigravity", la plateforme qui efface le disque D de certains utilisateurs

  9. #9
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    386
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 386
    Par défaut Vos écouteurs sans fil peuvent désormais traduire plus de 70 langues en temps réel grâce à l'IA Gemini
    Vos écouteurs sans fil peuvent désormais traduire plus de 70 langues en temps réel grâce à l'IA Gemini de Google

    Google a annoncé étendre les fonctionnalités de traduction de Search et de son application Translate avec de nouveaux systèmes basés sur le modèle Gemini AI. La mise à jour introduit une traduction de texte améliorée et une version bêta de la traduction vocale en direct dans les écouteurs sans fil, offrant aux utilisateurs des résultats plus clairs et plus naturels. Cela permet à l'application de produire des traductions plus proches du langage naturel plutôt que des substitutions directes de mots. La mise à jour concerne l'anglais et près de 20 autres langues dans l'application et le service web.

    Gemini (anciennement connu sous le nom de Bard) est un chatbot et assistant virtuel génératif basé sur l'intelligence artificielle développé par Google. Basé sur le grand modèle de langage (LLM) du même nom, il a été lancé le 21 mars 2023 en réponse à l'essor du ChatGPT d'OpenAI. En novembre 2025, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».

    Récemment, Google a annoncé étendre les fonctionnalités de traduction de Search et de son application Translate avec de nouveaux systèmes basés sur le modèle Gemini AI. La mise à jour introduit une traduction de texte améliorée et une version bêta de la traduction vocale en direct dans les écouteurs sans fil, offrant aux utilisateurs des résultats plus clairs et plus naturels. Le nouveau système de traduction de texte utilise Gemini 3 pour traiter les expressions idiomatiques, l'argot et les expressions locales avec une meilleure prise en compte du contexte.

    Cela permet à l'application de produire des traductions plus proches du langage naturel plutôt que des substitutions directes de mots. La mise à jour concerne l'anglais et près de 20 autres langues dans l'application et le service web. Le déploiement inclut l'espagnol, l'hindi, le chinois, le japonais et l'allemand, qui couvrent certaines des demandes de traduction les plus courantes.


    La version bêta de la traduction en direct utilise les capacités de Gemini en matière de conversion de la parole en parole (speech-to-speech) pour traiter le ton et le rythme. Les utilisateurs peuvent écouter les traductions en temps réel à l'aide de n'importe quel casque en sélectionnant la fonction en direct dans l'application. L'idée est de faciliter le suivi des conversations, des conférences ou des divertissements lorsqu'ils sont dans une autre langue. Elle permet également de séparer les différentes voix afin que les auditeurs puissent savoir qui parle.

    Google a testé cette fonctionnalité auprès des premiers utilisateurs et prévoit désormais de l'étendre. La version bêta est disponible sur Android aux États-Unis, au Mexique et en Inde. La société prévoit de la proposer sur iOS et dans d'autres régions en 2026.

    L'application Translate s'enrichit également de nouveaux outils d'apprentissage. Ceux-ci comprennent un meilleur retour d'information pendant les exercices d'expression orale et un suivi des progrès qui compte le nombre de jours consécutifs pendant lesquels un utilisateur continue à apprendre. Google affirme que les utilisateurs souhaitent des exercices d'apprentissage qui reflètent des situations quotidiennes et prévoit de continuer à ajouter de nouvelles options pour répondre à cette demande.

    Les fonctionnalités mises à jour pour la pratique des langues couvrent désormais l'Allemagne, l'Inde, la Suède et Taïwan. Les apprenants en anglais bénéficient également de nouveaux parcours à partir de langues telles que le bengali, le mandarin, le néerlandais, l'allemand, l'hindi, l'italien, le roumain et le suédois.

    Nom : 1.jpg
Affichages : 5792
Taille : 26,7 Ko

    Voici l'annonce de Google :

    Intégration des fonctionnalités de traduction de pointe de Gemini à Google Traduction

    La véritable compréhension ne repose pas uniquement sur ce que dit une personne, mais aussi sur les nuances de son discours. Aujourd'hui, Google Translate s'améliore dans ces deux domaines.

    Nous introduisons une qualité de traduction de texte de pointe dans la recherche et l'application Translate, grâce à Gemini. Cela signifie que vous obtiendrez des traductions de texte beaucoup plus intelligentes, naturelles et précises, quel que soit l'endroit où vous effectuez votre recherche. Nous déployons également une nouvelle version bêta de la traduction en direct, qui vous offre des traductions en temps réel et naturelles directement dans vos écouteurs grâce aux nouvelles capacités de traduction vocale native de Gemini. De plus, nous ajoutons de nouvelles langues que vous pourrez pratiquer dans l'application Traduction.

    Bénéficiez de traductions plus intelligentes et plus naturelles, grâce à Gemini

    À partir d'aujourd'hui, Google Traduction utilise les fonctionnalités avancées de Gemini pour améliorer les traductions de phrases aux significations plus nuancées, telles que les expressions idiomatiques, les expressions locales ou l'argot.

    Imaginons que vous essayiez de traduire une expression idiomatique anglaise telle que « stealing my thunder » (me voler la vedette). Il est désormais plus facile que jamais d'obtenir une traduction plus naturelle et plus précise, plutôt qu'une traduction littérale mot à mot. Gemini analyse le contexte pour vous fournir une traduction utile qui rend compte de la signification réelle de l'expression idiomatique.

    Nom : 2.jpg
Affichages : 1716
Taille : 30,8 Ko

    Cette mise à jour est déployée à partir d'aujourd'hui aux États-Unis et en Inde pour la traduction entre l'anglais et près de 20 langues, dont l'espagnol, l'hindi, le chinois, le japonais et l'allemand, dans l'application Translate (Android et iOS) et sur le Web.

    Écoutez et comprenez le monde en temps réel

    En nous appuyant sur les nouvelles capacités de traduction en direct de Gemini, nous déployons une version bêta qui vous permet d'écouter des traductions en temps réel dans vos écouteurs. Cette nouvelle fonctionnalité préserve le ton, l'intonation et le rythme de chaque locuteur afin de créer des traductions plus naturelles et de faciliter le suivi de ce qui est dit. Que vous essayiez d'avoir une conversation dans une autre langue, d'écouter un discours ou une conférence à l'étranger, ou de regarder une émission de télévision ou un film dans une autre langue, vous pouvez désormais mettre vos écouteurs, ouvrir l'application Translate, appuyer sur « Traduction en direct » et écouter une traduction en temps réel dans la langue de votre choix.

    Suite aux commentaires positifs reçus lors des premiers tests, nous sommes ravis de rendre cette version bêta plus largement disponible afin de recueillir encore plus de commentaires tandis que nous travaillons à affiner le modèle et l'expérience. À partir d'aujourd'hui, la version bêta est disponible dans l'application Traduction sur Android aux États-Unis, au Mexique et en Inde. Elle fonctionne avec n'importe quel casque et prend en charge plus de 70 langues. Nous la proposerons également sur iOS et dans d'autres pays en 2026. Essayez-la dans l'application Android et faites-nous part de vos impressions via les commentaires intégrés à l'application !

    Pratiquez et maîtrisez encore plus de langues dans Translate

    À partir d'aujourd'hui, nous élargissons également nos outils d'apprentissage des langues dans l'application Translate avec des commentaires améliorés afin que vous puissiez obtenir des conseils utiles basés sur votre pratique orale. Nous vous proposons également un moyen de vous mettre au défi et d'atteindre vos objectifs d'apprentissage en suivant le nombre de jours consécutifs pendant lesquels vous avez appris, afin que vous puissiez clairement voir vos progrès et votre régularité au fil du temps.

    Nom : 3.jpg
Affichages : 1713
Taille : 25,9 Ko

    Et nous étendons cette fonctionnalité à près de 20 nouveaux pays, dont l'Allemagne, l'Inde, la Suède et Taïwan, afin que davantage de personnes puissent continuer à perfectionner leurs compétences linguistiques, notamment :

    - De l'anglais vers l'allemand et le portugais
    - Du bengali, du chinois mandarin (simplifié), du néerlandais, de l'allemand, de l'hindi, de l'italien, du roumain et du suédois vers l'anglais

    Nom : 4.jpg
Affichages : 1710
Taille : 55,3 Ko

    Nos utilisateurs nous ont fait savoir qu'ils appréciaient les expériences d'apprentissage personnalisées qui reflètent des situations réelles. Nous continuerons à ajouter de nouvelles fonctionnalités pour aider les utilisateurs à progresser dans leurs objectifs d'apprentissage linguistique.

    Grâce à des modèles d'IA encore plus avancés et à des fonctionnalités d'apprentissage linguistique étendues dans Translate, nous vous aidons à saisir non seulement les mots, mais aussi leur signification. Nous sommes impatients de connaître votre avis.

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    L'IA de Google peut traduire ce que vous dites en conservant les caractéristiques de votre voix : Translatotron en est encore au stade expérimental

    L'intelligence artificielle d'Anthropic, Claude 3, bat Google Translate, et serait le plus intelligent des grands modèles de langage

    Une étude de Microsoft identifie les 40 emplois les plus vulnérables à l'IA, en particulier ceux liés à la création de contenu et à la langue, tout en soulignant la résilience des rôles pratiques et physiques
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Réponses: 0
    Dernier message: 11/05/2021, 18h55
  2. PlanetHoster annonce une nouvelle plateforme d'hébergement baptisée The World
    Par Michael Guilloux dans le forum Autres hébergeurs
    Réponses: 0
    Dernier message: 16/04/2018, 12h42
  3. [Annonce] Une nouvelle plateforme vidéo dédiée au PLM
    Par NoemieR dans le forum Autres Solutions d'entreprise
    Réponses: 0
    Dernier message: 15/11/2012, 17h15
  4. Valve annonce Steam Greenlight : une nouvelle plateforme pour les jeux indépendants
    Par LittleWhite dans le forum Développement 2D, 3D et Jeux
    Réponses: 17
    Dernier message: 27/07/2012, 17h21
  5. Migrer Suse vers une nouvelle plateforme matérielle
    Par mejdac dans le forum Administration système
    Réponses: 2
    Dernier message: 13/06/2008, 11h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo