Gemini 2.0 Flash : L’IA générative de Google bouscule les limites éthiques,
accessible à tous, elle soulève des questions sur la propriété intellectuelle et la désinformation
Google a publié un nouveau modèle d'intelligence artificielle capable de générer ou de modifier des images aussi facilement qu'il crée du texte, dans le cadre d'une conversation avec un chatbot. Bien que les résultats ne soient pas encore parfaits, il est probable que, dans un avenir proche, cette technologie devienne accessible à tous. L'entreprise a élargi l'accès aux capacités natives de génération d'images de Gemini 2.0 Flash, en rendant cette fonctionnalité expérimentale disponible pour tous les utilisateurs de Google AI Studio. Jusqu'à présent réservée aux testeurs depuis décembre, cette technologie multimodale combine traitement du texte et des images au sein d'un même modèle d'intelligence artificielle.
Les utilisateurs des réseaux sociaux ont mis en lumière une utilisation controversée du nouveau modèle d'IA Gemini de Google : la suppression des filigranes sur des images, notamment celles publiées par Getty Images et d'autres banques d'images renommées.
La semaine dernière, Google a élargi l'accès à la fonction de génération d'images de son modèle Gemini 2.0 Flash, qui permet non seulement de créer, mais aussi de modifier des images de manière native. Bien que cette capacité soit impressionnante, elle semble manquer de garde-fous. En effet, Gemini 2.0 Flash peut générer des images de célébrités ou de personnages protégés par des droits d’auteur et, comme l'ont remarqué plusieurs utilisateurs, il est également capable de supprimer les filigranes des photos existantes.New skill unlocked: Gemini 2 Flash model is really awesome at removing watermarks in images! pic.twitter.com/6QIk0FlfCv
— Deedy (@deedydas) March 15, 2025
Sur X et Reddit, plusieurs internautes ont signalé que le modèle ne se contente pas d’effacer les filigranes, mais tente aussi de recréer les zones sous-jacentes pour les rendre invisibles. Si d’autres outils d’intelligence artificielle offrent des fonctionnalités similaires, Gemini 2.0 Flash semble particulièrement efficace dans ce domaine, et son accès est gratuit.
[Tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Gemini 2.0 Flash, available in Google's AI studio, is amazing at editing images with simple text prompts. <br><br>It also can remove watermarks from images (and puts its own subtle watermark in instead 🤣<a href="https://t.co/ZnHTQJsT1Z">pic.twitter.com/ZnHTQJsT1Z</a></p>— Tanay Jaipuria (@tanayj) <a href="https://twitter.com/tanayj/status/1901362361476296858?ref_src=twsrc%5Etfw">March 16, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[Tweet]
À noter que cette fonctionnalité de génération d’images est actuellement qualifiée d'« expérimentale » et « non destinée à la production », et qu’elle est uniquement disponible via les outils de développement de Google, comme AI Studio. Par ailleurs, le modèle ne parvient pas toujours à supprimer certains filigranes, notamment ceux qui sont semi-transparents ou qui couvrent une large partie de l’image.
Néanmoins, l'absence de restrictions sur cette utilisation risque de susciter l’indignation des détenteurs de droits d’auteur. D'autres modèles, comme Claude 3.7 Sonnet d’Anthropic et GPT-4o d’OpenAI, refusent explicitement d’exécuter cette tâche, considérant la suppression d’un filigrane comme « contraire à l’éthique et potentiellement illégale ». Aux États-Unis, retirer un filigrane sans l’autorisation du propriétaire est généralement illégal au regard de la loi sur le droit d’auteur, sauf exceptions spécifiques.
Interrogé sur la question, Google n’a pas répondu immédiatement aux demandes de commentaires faites en dehors des heures de bureau. Toutefois, un porte-parole de l’entreprise a déclaré : « L'utilisation des outils d'IA générative de Google pour enfreindre les droits d’auteur constitue une violation de nos conditions d'utilisation. Comme pour toutes les versions expérimentales, nous surveillons de près et écoutons les retours des développeurs. »
Google accélère l'IA avec Gemini 2.0 : innovation, agenticité et accessibilité
En décembre 2024, Google a lancé Gemini 2.0, un modèle d’intelligence artificielle promettant d’être plus rapide et plus performant grâce aux avancées en agenticité et aux capacités multimodales améliorées. Cette annonce est survenue peu après la sortie du modèle expérimental Gemini-Exp-1206, qui s’est rapidement hissé en tête du classement Chatbot Arena, surpassant GPT-4o d’OpenAI.
Sundar Pichai, PDG de Google et d'Alphabet, a souligné que l’organisation et l’accessibilité de l’information restent au cœur de la mission de l’entreprise. Avec Gemini 1.0 et 1.5, Google avait déjà fait des avancées significatives en matière de multimodalité, permettant au modèle de comprendre et traiter texte, vidéo, image, audio et code de manière plus approfondie. Aujourd’hui, des millions de développeurs utilisent Gemini pour réinventer les produits Google, notamment NotebookLM, qui exploite la multimodalité et le contexte long pour améliorer la productivité.
Avec Gemini 2.0, Google franchit une nouvelle étape en développant des modèles plus agentiques, capables de mieux comprendre leur environnement, d’anticiper des actions et d’agir sous la supervision des utilisateurs. Le modèle intègre désormais des sorties natives en image et en son, et s’accompagne d’une nouvelle fonctionnalité, Deep Research, qui exploite des capacités avancées de raisonnement pour compiler des rapports détaillés.
Google met Gemini 2.0 entre les mains des développeurs et des testeurs de confiance avant de l’intégrer progressivement dans ses produits phares comme Gemini et Search. La version expérimentale Gemini 2.0 Flash est désormais disponible pour tous les utilisateurs de Gemini.
L’IA joue également un rôle clé dans Search, où les aperçus d’IA permettent à plus d’un milliard de personnes de poser des questions plus complexes. Gemini 2.0 introduira des capacités de raisonnement avancées pour traiter des sujets plus complexes, y compris les équations mathématiques avancées, les requêtes multimodales et le codage.
L’amélioration de Gemini 2.0 repose sur des investissements massifs en IA, notamment avec Trillium, la puce TPU de sixième génération de Google, qui alimente entièrement l’entraînement et l’inférence des modèles Gemini. Désormais, Trillium est accessible aux clients, leur offrant une puissance de calcul IA avancée. Selon Sundar Pichai, si Gemini 1.0 était conçu pour organiser et comprendre l’information, Gemini 2.0 vise à la rendre encore plus utile.
Google mise sur l’IA pour booster la productivité des développeurs
En février 2025, Google a rendu accessible gratuitement Gemini Code Assist, un outil de codage assisté par IA, destiné aux développeurs du monde entier. Deux versions sont proposées : une pour les particuliers et une intégrée à GitHub. L’objectif est d’améliorer la productivité des développeurs, du simple étudiant au créateur de startup, sans contrainte de coût ou de restrictions d’usage. Cette annonce fait suite au lancement de Jules, un assistant d’IA capable de corriger des bogues de manière autonome et d’accélérer les cycles de développement grâce à Gemini 2.0.
D’après l’étude DORA de Google, 75 % des développeurs utilisent déjà l’IA dans leurs tâches quotidiennes. Chez Google, 25 % du nouveau code est généré par l’IA, avant d’être validé par les ingénieurs. Avec ces innovations, Google confirme sa volonté d’intégrer l’IA dans tous les aspects du développement logiciel et d’accélérer l’adoption des modèles génératifs dans l’industrie.
Comme l'ont fait remarquer plusieurs utilisateurs de X et de Reddit, Gemini 2.0 Flash ne se contente pas de supprimer les filigranes, mais tente également de combler les lacunes créées par la suppression d'un filigrane. D'autres outils dotés d'une intelligence artificielle le font également, mais Gemini 2.0 Flash semble être exceptionnellement compétent dans ce domaine, et son utilisation est gratuite.
Pour être clair, la fonction de génération d'images de Gemini 2.0 Flash est qualifiée d'« expérimentale » et de « non destinée à la production » pour le moment, et n'est disponible que dans les outils de Google destinés aux développeurs, comme AI Studio. Le modèle n'est pas non plus parfait pour supprimer les filigranes. Gemini 2.0 Flash semble avoir des difficultés avec certains filigranes semi-transparents et avec les filigranes qui recouvrent de grandes parties d'images.
Néanmoins, certains détenteurs de droits d'auteur ne manqueront pas de s'offusquer de l'absence de restrictions d'utilisation de Gemini 2.0 Flash. Certains modèles, dont le Claude 3.7 Sonnet d'Anthropic et le GPT-4o d'OpenAI, refusent explicitement de supprimer les filigranes ; Claude qualifie la suppression d'un filigrane d'une image de « contraire à l'éthique et potentiellement illégale ».
L’intelligence artificielle et la manipulation d’images : Où tracer la ligne rouge ?
L'émergence de Gemini 2.0 Flash souligne une avancée significative dans l’édition d’images par intelligence artificielle, rendant cette tâche accessible à un public bien plus large qu’auparavant. Cependant, la question qui se pose est celle des limites et des responsabilités associées à une telle technologie.
Si la possibilité de modifier une image par une simple requête textuelle ouvre des perspectives fascinantes, elle soulève aussi des préoccupations majeures. L’un des enjeux les plus sensibles est la suppression des filigranes, un élément crucial pour la protection des droits d’auteur et l’authentification des images. Contrairement à d’autres modèles qui imposent des restrictions éthiques sur ce point, Gemini 2.0 Flash semble, pour l’instant, fonctionner sans garde-fous clairs.
L’argument de l’expérimentation et du caractère « non destiné à la production » ne suffit pas à rassurer pleinement. L’accès relativement libre à ces fonctionnalités pose la question du détournement potentiel de l’outil, notamment en facilitant la suppression de marques d’authenticité sur des images protégées. Cela peut avoir des implications importantes pour les créateurs de contenu, les médias et les institutions luttant contre la désinformation.
D’un autre côté, cette avancée technique témoigne de l’évolution inéluctable de l’intelligence artificielle vers une interactivité toujours plus fluide et intuitive. Le fait que Google entraîne Gemini 2.0 sur un espace neuronal combinant texte et image renforce sa capacité à comprendre et manipuler le visuel avec une précision croissante. Si cette technologie est bien encadrée, elle pourrait devenir un outil précieux pour les designers, les créateurs et les professionnels du multimédia.
Toutefois, la frontière entre innovation et abus reste mince. Sans un encadrement strict et des protections intégrées, Gemini 2.0 Flash pourrait être perçu comme un outil facilitant les violations de propriété intellectuelle plutôt qu’un simple progrès technologique. Il appartient désormais à Google de démontrer sa capacité à instaurer des mécanismes de contrôle responsables, tout en maintenant les avancées permises par l’IA générative.
Source : Google
Et vous ?
Jusqu’où peut-on considérer cette innovation comme bénéfique avant qu’elle ne devienne une menace pour la propriété intellectuelle ?
La suppression des filigranes et la modification avancée des images peuvent-elles être exploitées à des fins frauduleuses ou malveillantes ?
L’argument du caractère « expérimental » de cette technologie exonère-t-il Google de toute responsabilité en cas d’utilisation abusive ?
Voir aussi :
L'outil d'IA de codage de Google Gemini est désormais gratuit pour les utilisateurs individuels et fournit 90 fois plus de complétions de code par mois que la version gratuite de GitHub Copilot
Gemini se dote de nouveaux outils de codage et d'écriture, ainsi que d'une fonctionnalité générant des « podcasts » par IA à partir de simples requêtes
Google lance son nouveau modèle d'IA Gemini 2.0 pour pratiquement tout, qui promet d'être plus rapide et plus intelligent grâce aux progrès agentiques et offre des capacités avancées de sorties multimodales
Partager