IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Google lance Gemini 3.5 Flash, son nouveau modèle d'IA le plus performant pour la programmation


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    746
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 746
    Par défaut Google lance Gemini 3.5 Flash, son nouveau modèle d'IA le plus performant pour la programmation
    Google lance Gemini 3.5 Flash, son modèle d'IA le plus performant pour la programmation, la création d'agents IA autonomes, la gestion de projets de recherche ou le développement de systèmes d'exploitation

    Google a lancé Gemini 3.5 Flash, un nouveau modèle d’IA que l’entreprise présente comme son plus performant à ce jour pour le codage et les agents IA autonomes. Ce modèle, dévoilé lors de la conférence annuelle des développeurs Google I/O, est capable d’exécuter de manière autonome des pipelines de codage, de gérer des projets de recherche et, lors de tests internes, de créer un système d’exploitation entièrement à partir de zéro. Ce lancement marque le passage de Google d’une IA présentée comme un outil conversationnel à une IA présentée comme un outil agentique.

    Gemini est une famille de grands modèles de langage multimodaux (LLM) développée par Google DeepMind, qui succède à LaMDA et PaLM 2. Composée de Gemini Pro, Gemini Deep Think, Gemini Flash et Gemini Flash Lite, elle a été annoncée le 6 décembre 2023. Elle alimente le chatbot du même nom. Gemini (également connu sous le nom de Google Gemini et anciennement appelé Bard) est un chatbot et assistant virtuel basé sur l'intelligence artificielle générative développé par Google.

    L'architecture Gemini est entraînée en natif sur plusieurs types de données, ce qui permet aux modèles de traiter et de générer simultanément du texte, du code informatique, des images, de l'audio et de la vidéo. Google distribue cette technologie sous différentes formes, allant de versions efficaces sur appareil (« Nano ») et de variantes économiques à haut débit (« Flash ») à des modèles à haute puissance de calcul conçus pour le raisonnement complexe (« Pro » et « Ultra »). Les générations de modèles 1.5 et 3 ont introduit des fenêtres de contexte étendues, permettant l'analyse de grands ensembles de données tels que des bases de code entières, des vidéos longues ou de vastes archives de documents en une seule requête.

    Récemment, Google a lancé Gemini 3.5 Flash, un nouveau modèle d’IA que l’entreprise présente comme son plus performant à ce jour pour le codage et les agents IA autonomes. Ce modèle, dévoilé lors de la conférence annuelle des développeurs Google I/O, est capable d’exécuter de manière autonome des pipelines de codage, de gérer des projets de recherche et, lors de tests internes, de créer un système d’exploitation entièrement à partir de zéro.


    Ce lancement marque le passage de Google d’une IA présentée comme un outil conversationnel à une IA présentée comme un outil agentique. Il ne s’agit plus seulement de répondre à des questions, mais de planifier, de construire et d’itérer sur du travail réel avec un minimum d’intervention humaine. Koray Kavukcuoglu, directeur technique de DeepMind, a déclaré aux journalistes avant le lancement public : « 3.5 Flash offre une combinaison incroyable de qualité et de faible latence. Il surpasse notre dernier modèle de pointe, 3.1 Pro, sur presque tous les benchmarks », notamment le codage, les tâches agentiques et le raisonnement multimodal.

    Il a ajouté qu’il est quatre fois plus rapide que les autres modèles de pointe, une vitesse idéale pour le codage et les tâches agentiques, mais que Google l’a « porté à un autre niveau » en développant une version optimisée de Flash qui est douze fois plus rapide tout en conservant la même qualité. Cette vitesse est au cœur de la conception de Flash pour le travail agentique, où plusieurs agents IA s’exécutent simultanément sur des tâches de longue durée, selon Kavukcuoglu.

    Sur la scène de l’I/O, l’ingénieur de Google Varun Mohan a montré des agents se multipliant pour travailler sur des composants distincts avant de se regrouper pour construire un système d’exploitation complet au sein d’Antigravity, la plateforme de développement agentique et l’IDE de l’entreprise. Kavukcuoglu a déclaré que Flash 3.5 avait été développé en collaboration avec Antigravity afin que les agents puissent disposer d’un « environnement natif où ils peuvent vivre, travailler et agir ».


    Voici l'annonce de Google :

    Gemini 3.5 : une intelligence de pointe au service de l'action

    Nous présentons aujourd'hui Gemini 3.5, notre toute dernière famille de modèles alliant une intelligence de pointe à la capacité d'agir. Il s'agit d'un bond en avant majeur dans la création d'agents plus performants et plus intelligents. Nous inaugurons cette série avec le lancement de 3.5 Flash. Ce modèle offre des performances de pointe pour les agents et le codage, et excelle dans les tâches complexes à long terme qui apportent une utilité concrète.

    3.5 Flash est disponible dès aujourd’hui pour des milliards de personnes à travers le monde :

    - Pour tous via l’application Gemini et le mode IA dans la recherche Google
    - Pour les développeurs sur notre plateforme de développement axée sur les agents Google Antigravity et l’API Gemini dans Google AI Studio et Android Studio
    - Pour les entreprises sur la plateforme Gemini Enterprise Agent et Gemini Enterprise.

    Nous travaillons également d'arrache-pied sur la version 3.5 Pro. Elle est déjà utilisée en interne, et nous avons hâte de la déployer le mois prochain.

    3.5 Flash : des performances de pointe pour les agents et le codage

    Gemini 3.5 Flash offre une intelligence qui rivalise avec les grands modèles phares sur plusieurs plans, à la vitesse que vous êtes en droit d'attendre de la série Flash. Il s'agit de notre modèle d'agent et de codage le plus performant à ce jour, surpassant Gemini 3.1 Pro sur des benchmarks exigeants en matière de codage et d'agent, tels que Terminal-Bench 2.1 (76,2 %), GDPval-AA (1656 Elo) et MCP Atlas (83,6 %), et se plaçant en tête en matière de compréhension multimodale (84,2 % sur CharXiv Reasoning). En termes de tokens de sortie par seconde, il est 4 fois plus rapide que les autres modèles de pointe.

    Nom : 1.jpg
Affichages : 525
Taille : 108,5 Ko

    Se classant dans le quadrant supérieur droit de l’indice Artificial Analysis, 3.5 Flash offre une intelligence de pointe à une vitesse exceptionnelle — prouvant ainsi qu’il n’est plus nécessaire de sacrifier la qualité au profit de la latence.

    Nom : 2.jpg
Affichages : 468
Taille : 24,8 Ko

    3.5 Flash : tâches agentiques à grande échelle

    Cet équilibre entre vitesse et performance rend 3.5 Flash idéal pour s’attaquer à des tâches agentiques à long terme. Ce qui prenait auparavant des jours à un développeur ou des semaines à un auditeur, 3.5 Flash peut désormais aider à le réaliser en une fraction du temps, souvent à moins de la moitié du coût des autres modèles de pointe. Il planifie, construit et itère rapidement pour résoudre des problèmes du monde réel, qu’il s’agisse de développer de nouvelles applications, de maintenir des bases de code ou d’aider à préparer des documents financiers.

    Associé au harnais Antigravity mis à jour, 3.5 Flash devient un puissant moteur permettant de déployer des sous-agents collaboratifs pour résoudre des problèmes à grande échelle dans les cas d'utilisation les plus exigeants. Sous supervision, il peut exécuter de manière fiable des workflows en plusieurs étapes et des tâches de codage tout en conservant des performances de pointe.

    3.5 Flash : impact concret

    Les capacités agentiques concrètes de 3.5 Flash permettent déjà de réaliser des progrès significatifs tant pour nos développeurs que pour les entreprises. Lors du développement de la série de modèles 3.5, nous avons travaillé en étroite collaboration avec des partenaires du secteur afin de comprendre où se situaient les difficultés et la complexité dans leurs flux de travail. Nos partenaires constatent un impact significatif, qu'il s'agisse de banques et de fintechs automatisant des flux de travail de plusieurs semaines ou d'équipes de science des données mettant au jour des informations pertinentes au sein d'environnements de données complexes.


    Agents IA personnels : développés avec 3.5 Flash

    3.5 Flash est désormais le modèle par défaut de l'application Gemini et du mode IA dans la recherche à l'échelle mondiale. Lors de la conférence I/O d'aujourd'hui, nous avons montré comment ses capacités d'agent alimentent de nouvelles fonctionnalités afin d'apporter une intelligence de pointe à votre quotidien.

    Le nouveau Gemini Spark, votre agent IA personnel, utilise 3.5 Flash. Il fonctionne 24 h/24 et 7 j/7, vous aidant à naviguer dans votre vie numérique et agissant en votre nom sous votre direction. Nous commençons dès aujourd’hui à déployer Gemini Spark auprès de testeurs de confiance, et nous prévoyons de proposer la version bêta aux abonnés de Google AI Ultra aux États-Unis la semaine prochaine.

    Nom : 3.jpg
Affichages : 469
Taille : 48,1 Ko

    Les capacités de codage agentique améliorées de 3.5 Flash offrent également des expériences encore plus intelligentes dans la Recherche, qu'il s'agisse de l'introduction de nouveaux agents d'information qui travaillent pour vous 24 h/24 et 7 j/7 ou de la mise en place d'expériences d'interface utilisateur génératives plus dynamiques. Pour en savoir plus, consultez notre article de blog.

    Gemini 3.5 : conçu avec des mesures de sécurité de pointe

    Gemini 3.5 a été développé conformément à notre cadre de sécurité Frontier. Nous avons renforcé nos mesures de sécurité cyber et CBRN, ce qui signifie qu'il est moins susceptible de générer du contenu préjudiciable et de refuser par erreur de répondre à des requêtes inoffensives. Nous y parvenons grâce à de nouvelles formations et mesures de sécurité plus avancées, notamment des outils d'interprétabilité qui permettent de vérifier et de comprendre le raisonnement interne de l'IA avant qu'elle ne fournisse une réponse.

    3.5 Flash est disponible dès aujourd’hui

    Gemini 3.5 Flash est disponible pour tous via Google Antigravity, l’API Gemini dans Google AI Studio et Android Studio, la plateforme Gemini Enterprise Agent et Gemini Enterprise. Il est également désormais accessible à tous dans l’application Gemini et en mode IA dans la recherche. Au nom de toute l’équipe Gemini, nous sommes impatients de découvrir ce que vous allez créer.

    Source : Annonce de Google

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

    OpenAI lance GPT-5.5, son tout dernier modèle d'IA, que la société qualifie de « modèle le plus intelligent et le plus intuitif à utiliser » à ce jour, et plus performant en matière de programmation

    Anthropic écrase GPT-5.4 avec le lancement de Claude Opus 4.7, un modèle d'IA moins risqué et moins puissant que Mythos, mais nettement plus efficace que la version 4.6
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    746
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 746
    Par défaut Google annonce Gemini 3.5 Live Translate, un outil de traduction vocale en temps réel
    Google annonce Gemini 3.5 Live Translate, un outil de traduction vocale en temps réel qui préserve le ton, le rythme et la hauteur de voix de l'orateur, avec des filigranes SynthID pour plus de sécurité

    Google a annoncé Gemini 3.5 Live Translate, son tout dernier modèle de traduction vocale en temps réel. Ce modèle peut détecter plus de 70 langues et générer « une traduction vocale fluide et naturelle » qui préserve l’intonation, le rythme et la hauteur de la voix. Contrairement aux systèmes de traduction tour par tour qui « attendent que l’orateur ait fini de parler avant de répondre », ce modèle génère de la parole en continu. En matière de sécurité, tous les fichiers audio générés sont marqués d'un filigrane SynthID.

    En mai 2026, Google a lancé Gemini 3.5 Flash, un nouveau modèle d’IA que l’entreprise présente comme son plus performant à ce jour pour le codage et les agents IA autonomes. Ce modèle, dévoilé lors de la conférence annuelle des développeurs Google I/O, est capable d’exécuter de manière autonome des pipelines de codage, de gérer des projets de recherche et, lors de tests internes, de créer un système d’exploitation entièrement à partir de zéro. Ce lancement marque le passage de Google d’une IA présentée comme un outil conversationnel à une IA présentée comme un outil agentique.

    Récemment, Google a annoncé Gemini 3.5 Live Translate, son tout dernier modèle de traduction vocale en temps réel. Ce modèle peut détecter plus de 70 langues et générer « une traduction vocale fluide et naturelle » qui préserve l’intonation, le rythme et la hauteur de la voix. Contrairement aux systèmes de traduction tour par tour qui « attendent que l’orateur ait fini de parler avant de répondre », ce modèle génère de la parole en continu. Il en résulte « un son fluide, sans pauses gênantes, qui ne prend que quelques secondes de retard sur l’orateur tout au long de la session ».

    Gemini 3.5 Live Translate est en cours de déploiement sur Google Translate pour Android et iOS. Appuyez sur « Live Translate » dans le coin inférieur gauche tout en portant un casque. L'application Android déploie également un nouveau « mode d'écoute » qui vous permet d'entendre les traductions via l'écouteur du téléphone lorsque vous n'avez pas de casque à portée de main. Il vous suffit de « tenir votre téléphone contre votre oreille, comme pour un appel classique ». Gemini 3.5 Live Translate est également disponible en préversion publique pour les développeurs via l'API Gemini Live et Google AI Studio.

    En matière de sécurité, tous les fichiers audio générés sont marqués d'un filigrane SynthID. Selon Google, ce filigrane imperceptible est directement intégré à la sortie audio, garantissant que le contenu généré par l'IA reste détectable afin d'aider à prévenir la désinformation.


    Voici l'annonce de Google :

    Une traduction vocale fluide et naturelle avec Gemini 3.5 Live Translate

    Il y a vingt ans, la traduction chez Google a débuté comme l’une de nos expériences pionnières en apprentissage automatique, visant à transformer la science du langage en la magie de la connexion humaine. Cette expérience a fait un long chemin, avec plus d’un billion de mots traduits chaque mois pour des milliards d’utilisateurs à travers nos produits.

    Aujourd’hui, nous franchissons une nouvelle étape avec le lancement de Gemini 3.5 Live Translate, notre dernier modèle audio dédié à la traduction vocale en direct.

    Le modèle détecte automatiquement plus de 70 langues et génère une traduction vocale fluide et naturelle qui préserve l'intonation, le rythme et la hauteur de voix de l'orateur. Contrairement aux systèmes « tour par tour » qui attendent que l'orateur ait fini de parler avant de répondre, 3.5 Live Translate génère la traduction en continu, trouvant le juste équilibre entre l'attente d'un contexte plus complet pour améliorer la qualité et la traduction immédiate pour rester en phase avec l'orateur. Il offre un son fluide sans pauses gênantes et ne prend que quelques secondes de retard sur l'orateur tout au long de la session.

    Gemini 3.5 Live Translate est déployé dès aujourd'hui sur l'ensemble des produits Google :

    - Pour les développeurs, en préversion publique via l'API Gemini Live et Google AI Studio
    - Pour les entreprises, en préversion privée à partir de ce mois-ci dans Google Meet
    - Pour tous, via Google Translate sur Android et iOS

    Développez avec 3.5 Live Translate

    Gemini 3.5 Live Translate traite la parole au fur et à mesure de sa diffusion, permettant une connexion plus fluide entre les langues. Le modèle gère les entrées multilingues sans qu'il soit nécessaire de configurer manuellement les paramètres. Parallèlement, sa résistance au bruit garantit que les applications peuvent fonctionner dans des environnements bruyants et imprévisibles. Vous pouvez utiliser ses capacités pour faciliter l'interprétation en direct lors d'appels, de réunions, de cours, d'émissions et bien plus encore.

    Découvrez l'API Gemini Live en action, permettant le doublage et la traduction multilingue simultanée. Plongez-vous dans la démo ou consultez d'autres exemples de code dans le Gemini Cookbook.

    En utilisant l'API Gemini Live, des plateformes de développement telles qu'Agora, Fishjam, LiveKit, Pipecat et Vision Agents permettent aux développeurs de créer et de déployer facilement des applications de traduction vocale. Ces intégrations gèrent l'infrastructure complexe de diffusion multimédia en temps réel, afin que les développeurs puissent se concentrer sur l'expérience utilisateur.

    Nos partenaires chez Grab testent actuellement le modèle afin de permettre une communication multilingue en temps quasi réel entre les chauffeurs et les passagers lors des prises en charge. Ces utilisateurs passent plus de 10 millions d'appels vocaux par mois via Grab.


    Découvrez la version 3.5 de Live Translate lors de vos visioconférences

    La traduction vocale dans Google Meet utilisera bientôt la version 3.5 de Live Translate, améliorant ainsi l'expérience grâce aux fonctionnalités suivantes :

    - Proposant plus de 70 langues, une amélioration par rapport à la limite précédente de seulement cinq langues,
    - Permettant des conversations dans plus de 2 000 combinaisons linguistiques au cours d'une même réunion, contre une traduction uniquement vers et depuis l'anglais auparavant,
    - Mettant à jour l'interface pour offrir un accès instantané à la traduction vocale.

    Nous lançons cette mise à jour en avant-première privée pour certains clients professionnels de Google Workspace à partir de ce mois-ci, avant un déploiement plus large dans le courant de l'année.


    Bénéficiez de la version 3.5 de Live Translate dans l'application Google Traduction sur Android ou iOS

    Le modèle est également déployé à l'échelle mondiale sur l'application Google Traduction, tant sur Android que sur iOS. Lorsque vous utilisez la fonctionnalité Live Translate, il vous suffit de brancher n'importe quel casque pour bénéficier d'une traduction plus fluide qui reflète le ton de l'orateur dans plus de 70 langues.

    Pour les utilisateurs d'Android, nous commençons également à déployer un nouveau « mode d'écoute » avec la version 3.5 de Live Translate, qui vous permet d'entendre les traductions directement via l'écouteur de votre téléphone. Il vous suffit de porter votre téléphone à votre oreille comme pour un appel classique, et l'audio traduit vous parvient directement. Cette nouvelle fonctionnalité peut s'avérer utile dans les situations où vous souhaitez entendre rapidement les traductions sans que les autres ne les entendent, et où vous n'avez pas vos écouteurs à portée de main.

    Filigrane SynthID

    Tous les fichiers audio générés par nos modèles sont marqués d'un filigrane SynthID. Ce filigrane imperceptible est directement intégré au flux audio, garantissant que le contenu généré par l'IA reste identifiable afin de contribuer à la prévention de la désinformation. Pour plus de détails sur notre approche en matière de sécurité et de responsabilité, consultez la fiche du modèle.

    Source : Annonce de Google

    Et vous ?

    Pensez-vous que cette annonce est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Gemini 3.1 Flash Live : Google déploie un agent vocal si naturel qu'il serait plus difficile de savoir si vous parlez à un robot, offrant une expérience plus intuitive aux développeurs et aux entreprises

    NVIDIA publie un ensemble de données ouvertes et des modèles pour l'IA vocale multilingue, Granary a été utilisé pour former des modèles d'IA à haute précision et haut débit pour les traductions

    Le traducteur ChatGPT d'OpenAI rivalise avec Google Translate et vous permet de choisir le style du texte traduit, par exemple « professionnel », « académique » ou « plus fluide »
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Réponses: 29
    Dernier message: 08/05/2026, 11h34
  2. Réponses: 0
    Dernier message: 13/03/2026, 09h38
  3. Opera lance la version beta de son nouveau service de messagerie
    Par Hinault Romaric dans le forum Actualités
    Réponses: 4
    Dernier message: 12/04/2011, 17h21
  4. Réponses: 1
    Dernier message: 21/05/2010, 08h10
  5. Réponses: 1
    Dernier message: 21/05/2010, 08h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo