IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Gemini 2.0 Flash : L’IA générative de Google bouscule les limites éthiques


Sujet :

Intelligence artificielle

  1. #21
    Chroniqueur Actualités
    Avatar de Bruno
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Mai 2019
    Messages
    2 102
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Mai 2019
    Messages : 2 102
    Par défaut Gemini 2.0 Flash : L’IA générative de Google bouscule les limites éthiques
    Gemini 2.0 Flash : L’IA générative de Google bouscule les limites éthiques,
    accessible à tous, elle soulève des questions sur la propriété intellectuelle et la désinformation

    Google a publié un nouveau modèle d'intelligence artificielle capable de générer ou de modifier des images aussi facilement qu'il crée du texte, dans le cadre d'une conversation avec un chatbot. Bien que les résultats ne soient pas encore parfaits, il est probable que, dans un avenir proche, cette technologie devienne accessible à tous. L'entreprise a élargi l'accès aux capacités natives de génération d'images de Gemini 2.0 Flash, en rendant cette fonctionnalité expérimentale disponible pour tous les utilisateurs de Google AI Studio. Jusqu'à présent réservée aux testeurs depuis décembre, cette technologie multimodale combine traitement du texte et des images au sein d'un même modèle d'intelligence artificielle.

    Les utilisateurs des réseaux sociaux ont mis en lumière une utilisation controversée du nouveau modèle d'IA Gemini de Google : la suppression des filigranes sur des images, notamment celles publiées par Getty Images et d'autres banques d'images renommées.

    La semaine dernière, Google a élargi l'accès à la fonction de génération d'images de son modèle Gemini 2.0 Flash, qui permet non seulement de créer, mais aussi de modifier des images de manière native. Bien que cette capacité soit impressionnante, elle semble manquer de garde-fous. En effet, Gemini 2.0 Flash peut générer des images de célébrités ou de personnages protégés par des droits d’auteur et, comme l'ont remarqué plusieurs utilisateurs, il est également capable de supprimer les filigranes des photos existantes.

    Sur X et Reddit, plusieurs internautes ont signalé que le modèle ne se contente pas d’effacer les filigranes, mais tente aussi de recréer les zones sous-jacentes pour les rendre invisibles. Si d’autres outils d’intelligence artificielle offrent des fonctionnalités similaires, Gemini 2.0 Flash semble particulièrement efficace dans ce domaine, et son accès est gratuit.

    [Tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Gemini 2.0 Flash, available in Google's AI studio, is amazing at editing images with simple text prompts. <br><br>It also can remove watermarks from images (and puts its own subtle watermark in instead &#129315 <a href="https://t.co/ZnHTQJsT1Z">pic.twitter.com/ZnHTQJsT1Z</a></p>&mdash; Tanay Jaipuria (@tanayj) <a href="https://twitter.com/tanayj/status/1901362361476296858?ref_src=twsrc%5Etfw">March 16, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[Tweet]

    À noter que cette fonctionnalité de génération d’images est actuellement qualifiée d'« expérimentale » et « non destinée à la production », et qu’elle est uniquement disponible via les outils de développement de Google, comme AI Studio. Par ailleurs, le modèle ne parvient pas toujours à supprimer certains filigranes, notamment ceux qui sont semi-transparents ou qui couvrent une large partie de l’image.

    Néanmoins, l'absence de restrictions sur cette utilisation risque de susciter l’indignation des détenteurs de droits d’auteur. D'autres modèles, comme Claude 3.7 Sonnet d’Anthropic et GPT-4o d’OpenAI, refusent explicitement d’exécuter cette tâche, considérant la suppression d’un filigrane comme « contraire à l’éthique et potentiellement illégale ». Aux États-Unis, retirer un filigrane sans l’autorisation du propriétaire est généralement illégal au regard de la loi sur le droit d’auteur, sauf exceptions spécifiques.

    Interrogé sur la question, Google n’a pas répondu immédiatement aux demandes de commentaires faites en dehors des heures de bureau. Toutefois, un porte-parole de l’entreprise a déclaré : « L'utilisation des outils d'IA générative de Google pour enfreindre les droits d’auteur constitue une violation de nos conditions d'utilisation. Comme pour toutes les versions expérimentales, nous surveillons de près et écoutons les retours des développeurs. »

    Google accélère l'IA avec Gemini 2.0 : innovation, agenticité et accessibilité

    En décembre 2024, Google a lancé Gemini 2.0, un modèle d’intelligence artificielle promettant d’être plus rapide et plus performant grâce aux avancées en agenticité et aux capacités multimodales améliorées. Cette annonce est survenue peu après la sortie du modèle expérimental Gemini-Exp-1206, qui s’est rapidement hissé en tête du classement Chatbot Arena, surpassant GPT-4o d’OpenAI.

    Sundar Pichai, PDG de Google et d'Alphabet, a souligné que l’organisation et l’accessibilité de l’information restent au cœur de la mission de l’entreprise. Avec Gemini 1.0 et 1.5, Google avait déjà fait des avancées significatives en matière de multimodalité, permettant au modèle de comprendre et traiter texte, vidéo, image, audio et code de manière plus approfondie. Aujourd’hui, des millions de développeurs utilisent Gemini pour réinventer les produits Google, notamment NotebookLM, qui exploite la multimodalité et le contexte long pour améliorer la productivité.

    Avec Gemini 2.0, Google franchit une nouvelle étape en développant des modèles plus agentiques, capables de mieux comprendre leur environnement, d’anticiper des actions et d’agir sous la supervision des utilisateurs. Le modèle intègre désormais des sorties natives en image et en son, et s’accompagne d’une nouvelle fonctionnalité, Deep Research, qui exploite des capacités avancées de raisonnement pour compiler des rapports détaillés.

    Google met Gemini 2.0 entre les mains des développeurs et des testeurs de confiance avant de l’intégrer progressivement dans ses produits phares comme Gemini et Search. La version expérimentale Gemini 2.0 Flash est désormais disponible pour tous les utilisateurs de Gemini.

    L’IA joue également un rôle clé dans Search, où les aperçus d’IA permettent à plus d’un milliard de personnes de poser des questions plus complexes. Gemini 2.0 introduira des capacités de raisonnement avancées pour traiter des sujets plus complexes, y compris les équations mathématiques avancées, les requêtes multimodales et le codage.

    L’amélioration de Gemini 2.0 repose sur des investissements massifs en IA, notamment avec Trillium, la puce TPU de sixième génération de Google, qui alimente entièrement l’entraînement et l’inférence des modèles Gemini. Désormais, Trillium est accessible aux clients, leur offrant une puissance de calcul IA avancée. Selon Sundar Pichai, si Gemini 1.0 était conçu pour organiser et comprendre l’information, Gemini 2.0 vise à la rendre encore plus utile.

    Google mise sur l’IA pour booster la productivité des développeurs

    En février 2025, Google a rendu accessible gratuitement Gemini Code Assist, un outil de codage assisté par IA, destiné aux développeurs du monde entier. Deux versions sont proposées : une pour les particuliers et une intégrée à GitHub. L’objectif est d’améliorer la productivité des développeurs, du simple étudiant au créateur de startup, sans contrainte de coût ou de restrictions d’usage. Cette annonce fait suite au lancement de Jules, un assistant d’IA capable de corriger des bogues de manière autonome et d’accélérer les cycles de développement grâce à Gemini 2.0.

    D’après l’étude DORA de Google, 75 % des développeurs utilisent déjà l’IA dans leurs tâches quotidiennes. Chez Google, 25 % du nouveau code est généré par l’IA, avant d’être validé par les ingénieurs. Avec ces innovations, Google confirme sa volonté d’intégrer l’IA dans tous les aspects du développement logiciel et d’accélérer l’adoption des modèles génératifs dans l’industrie.

    Comme l'ont fait remarquer plusieurs utilisateurs de X et de Reddit, Gemini 2.0 Flash ne se contente pas de supprimer les filigranes, mais tente également de combler les lacunes créées par la suppression d'un filigrane. D'autres outils dotés d'une intelligence artificielle le font également, mais Gemini 2.0 Flash semble être exceptionnellement compétent dans ce domaine, et son utilisation est gratuite.

    Pour être clair, la fonction de génération d'images de Gemini 2.0 Flash est qualifiée d'« expérimentale » et de « non destinée à la production » pour le moment, et n'est disponible que dans les outils de Google destinés aux développeurs, comme AI Studio. Le modèle n'est pas non plus parfait pour supprimer les filigranes. Gemini 2.0 Flash semble avoir des difficultés avec certains filigranes semi-transparents et avec les filigranes qui recouvrent de grandes parties d'images.

    Néanmoins, certains détenteurs de droits d'auteur ne manqueront pas de s'offusquer de l'absence de restrictions d'utilisation de Gemini 2.0 Flash. Certains modèles, dont le Claude 3.7 Sonnet d'Anthropic et le GPT-4o d'OpenAI, refusent explicitement de supprimer les filigranes ; Claude qualifie la suppression d'un filigrane d'une image de « contraire à l'éthique et potentiellement illégale ».

    L’intelligence artificielle et la manipulation d’images : Où tracer la ligne rouge ?

    L'émergence de Gemini 2.0 Flash souligne une avancée significative dans l’édition d’images par intelligence artificielle, rendant cette tâche accessible à un public bien plus large qu’auparavant. Cependant, la question qui se pose est celle des limites et des responsabilités associées à une telle technologie.

    Si la possibilité de modifier une image par une simple requête textuelle ouvre des perspectives fascinantes, elle soulève aussi des préoccupations majeures. L’un des enjeux les plus sensibles est la suppression des filigranes, un élément crucial pour la protection des droits d’auteur et l’authentification des images. Contrairement à d’autres modèles qui imposent des restrictions éthiques sur ce point, Gemini 2.0 Flash semble, pour l’instant, fonctionner sans garde-fous clairs.

    L’argument de l’expérimentation et du caractère « non destiné à la production » ne suffit pas à rassurer pleinement. L’accès relativement libre à ces fonctionnalités pose la question du détournement potentiel de l’outil, notamment en facilitant la suppression de marques d’authenticité sur des images protégées. Cela peut avoir des implications importantes pour les créateurs de contenu, les médias et les institutions luttant contre la désinformation.


    D’un autre côté, cette avancée technique témoigne de l’évolution inéluctable de l’intelligence artificielle vers une interactivité toujours plus fluide et intuitive. Le fait que Google entraîne Gemini 2.0 sur un espace neuronal combinant texte et image renforce sa capacité à comprendre et manipuler le visuel avec une précision croissante. Si cette technologie est bien encadrée, elle pourrait devenir un outil précieux pour les designers, les créateurs et les professionnels du multimédia.

    Toutefois, la frontière entre innovation et abus reste mince. Sans un encadrement strict et des protections intégrées, Gemini 2.0 Flash pourrait être perçu comme un outil facilitant les violations de propriété intellectuelle plutôt qu’un simple progrès technologique. Il appartient désormais à Google de démontrer sa capacité à instaurer des mécanismes de contrôle responsables, tout en maintenant les avancées permises par l’IA générative.

    Source : Google

    Et vous ?

    Jusqu’où peut-on considérer cette innovation comme bénéfique avant qu’elle ne devienne une menace pour la propriété intellectuelle ?

    La suppression des filigranes et la modification avancée des images peuvent-elles être exploitées à des fins frauduleuses ou malveillantes ?

    L’argument du caractère « expérimental » de cette technologie exonère-t-il Google de toute responsabilité en cas d’utilisation abusive ?

    Voir aussi :

    L'outil d'IA de codage de Google Gemini est désormais gratuit pour les utilisateurs individuels et fournit 90 fois plus de complétions de code par mois que la version gratuite de GitHub Copilot

    Gemini se dote de nouveaux outils de codage et d'écriture, ainsi que d'une fonctionnalité générant des « podcasts » par IA à partir de simples requêtes

    Google lance son nouveau modèle d'IA Gemini 2.0 pour pratiquement tout, qui promet d'être plus rapide et plus intelligent grâce aux progrès agentiques et offre des capacités avancées de sorties multimodales
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #22
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 166
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 166
    Par défaut Google déploie des fonctionnalités IA en temps réel du "Projet Astra" de Gemini
    Google déploie des fonctionnalités IA en temps réel du "Projet Astra" de Gemini, qui permettent de répondre en temps réel à vos questions sur ce qui s'affiche sur l'écran de votre téléphone.

    Google déploie des fonctions d'IA pour l'interaction avec l'écran et la caméra. Les nouvelles fonctionnalités introduites comprennent la lecture d'écran et l'interprétation vidéo en direct, permettant à Gemini Live de répondre aux questions des utilisateurs sur ce qui s'affiche sur l'écran de leur téléphone ou à travers l'objectif de leur caméra.

    En février 2025, Google avait annoncé des mises à jour pour rendre Gemini 2.0 accessible à un plus grand nombre de développeurs et d'utilisateurs : Gemini 2.0 Flash était disponible en général, avec des limites de taux plus élevées, des performances accrues et une tarification simplifiée ; Gemini 2.0 Flash-Lite, une nouvelle variante qui serait le modèle le plus économique de Google à ce jour, était disponible en avant-première publique, et Gemini 2.0 Pro, une mise à jour expérimentale du meilleur modèle de Google pour le codage et les invites complexes, était également disponible.

    Récemment, Google a commencé à déployer de nouvelles fonctions d'intelligence artificielle (IA) sur sa plateforme Gemini Live, lui permettant d'interpréter visuellement et en temps réel les écrans de smartphones et les flux de caméras. Ces fonctionnalités, confirmées officiellement par Alex Joseph, porte-parole de Google, s'inscrivent dans le cadre d'une initiative plus large de l'entreprise en matière d'IA, connue sous le nom de « Project Astra ».


    Les capacités nouvellement introduites comprennent la lecture d'écran et l'interprétation vidéo en direct, permettant à Gemini Live de répondre aux questions des utilisateurs sur ce qui est affiché sur l'écran de leur téléphone ou à travers l'objectif de leur caméra. Le déploiement est exclusif aux abonnés Gemini Advanced dans le cadre du plan Google One AI Premium, et la disponibilité s'étendra progressivement tout au long du mois.

    Selon Joseph, la fonction de lecture d'écran permet aux utilisateurs de poser des questions à Gemini sur n'importe quel contenu visible sur l'écran de leur smartphone, en leur offrant des réponses contextuelles. Quant à la fonction de vidéo en direct, elle exploite la caméra d'un smartphone pour fournir une analyse en temps réel de ce qui est regardé. Par exemple, les utilisateurs peuvent demander à Gemini d'identifier des objets, de suggérer des décisions esthétiques ou même de les guider dans des tâches telles que le choix d'une couleur de peinture pour une poterie fraîchement émaillée.

    Le lancement de Google intervient alors que ses concurrents se démènent pour rattraper leur retard. Amazon se prépare à lancer sa mise à jour Alexa Plus avec des capacités similaires, mais reste en accès anticipé. Apple, quant à lui, a retardé la sortie de son Siri remanié, qui devrait également offrir des fonctionnalités d'IA améliorées. Samsung continue de s'appuyer sur son assistant Bixby, mais l'intégration transparente de Gemini dans ses téléphones donne un avantage certain à Google.

    Annoncé pour la première fois il y a près d'un an, le Projet Astra représente l'effort de Google pour redéfinir les limites de ce que les assistants numériques peuvent accomplir. En combinant l'analyse visuelle et le traitement du langage naturel, Google vise à créer une expérience d'IA plus interactive et plus intuitive.



    Et vous ?

    Pensez-vous que ces fonctionnalités sont crédibles ou pertinentes ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Le projet Astra est l'avenir de l'IA chez Google : un assistant d'IA multimodal qui peut voir le monde via la caméra de votre appareil et analyser et comprendre les objets devant lui comme le font les humains

    Google et Samsung dévoilent la plateforme de réalité mixte Android XR, pour l'informatique spatiale comme celle de l'Apple Vision Pro pour les casques et les lunettes intelligentes

    L'IA Gemini de Google peut désormais consulter votre historique de recherche pour personnaliser ses réponses, mais la fonction suscite des préoccupations en matière de protection de la vie privée
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #23
    Candidat au Club
    Femme Profil pro
    Consultant informatique
    Inscrit en
    Mars 2025
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Mars 2025
    Messages : 4
    Par défaut Gemini 2.0
    Gemini 2.0 marque un bond en avant impressionnant pour l'IA, avec des performances accrues et une vitesse remarquable. La multimodalité et les capacités agentiques ouvrent des perspectives passionnantes, notamment pour les développeurs. La concurrence avec OpenAI s'intensifie, et c'est une excellente nouvelle pour l'innovation. Vivement les retours des testeurs !

Discussions similaires

  1. Google lance son nouveau routeur Wi-Fi à usage domestique
    Par Stéphane le calme dans le forum Hardware
    Réponses: 14
    Dernier message: 21/08/2015, 20h04
  2. NETGEAR lance son nouveau ReadyNAS destiné aux particuliers
    Par Mejdi20 dans le forum Communiqués
    Réponses: 0
    Dernier message: 26/08/2010, 21h02
  3. Google lance son API Google Analytics
    Par Kerod dans le forum Général Conception Web
    Réponses: 2
    Dernier message: 23/04/2009, 23h52
  4. Google lance son générateur de sitemap
    Par Kerod dans le forum Webmarketing
    Réponses: 4
    Dernier message: 15/02/2009, 13h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo