IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

TikTok est inondé de vidéos à caractère raciste et antisémite créées à l'aide de l'outil Veo 3 de Google


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 336
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 336
    Par défaut TikTok est inondé de vidéos à caractère raciste et antisémite créées à l'aide de l'outil Veo 3 de Google
    Google Deepmind présente Veo 2, un nouvel outil de génération de vidéos par l'IA pour créer des "vidéos d'une qualité incroyable" dans le but de battre Sora d'OpenAI et d'être le meilleur modèle IA vidéo

    Google Deepmind a présenté Veo 2, un nouvel outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable". Cette annonce intervient après le lancement de la version officielle de Sora, le modèle de génération de vidéo par IA d'OpenAI, montrant la volonté de Google de concurrencer OpenAI. Selon Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et est moins susceptible d'"halluciner" des détails indésirables.

    Ce mois de décembre, OpenAI a lancé la version officielle de son programme de génération de vidéos par intelligence artificielle "Sora". Le programme intègre des messages écrits et crée des vidéos numériques d'une durée maximale de 20 secondes. Mais l'entreprise précise que le programme a encore des limites. De plus, OpenAI a déclaré que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

    En réponse, Google Deepmind a présenté Veo 2, un nouvel outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable", dans le but de battre OpenAI. Nouvelle itération de Veo, l'outil phare de conversion de texte en vidéo de Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et Google a mis l'accent sur sa compréhension des demandes cinématographiques.

    Pour montrer les capacités de Veo 2, Google a déclaré : "Suggérez objectif 18 mm" dans votre requête et Veo 2 saura créer le plan grand angle pour lequel cet objectif est connu, ou estompez l'arrière-plan et concentrez-vous sur votre sujet en ajoutant "faible profondeur de champ" dans votre requête. De plus, Google affirme que Veo 2 est moins susceptible d'"halluciner" des détails indésirables et a une "meilleure compréhension de la physique du monde réel et des nuances des mouvements et de l'expression humaine".

    Toutefois, Google a fait preuve de circonspection en ce qui concerne l'accès à l'outil. Actuellement, les utilisateurs ne peuvent accéder à Veo 2 que par l'intermédiaire de leur plateforme VideoFX, qui dispose d'une liste d'attente. Une fois inscrits, les utilisateurs ne pourront toujours pas exploiter toutes les capacités de l'outil, car il est limité à une résolution de 720p et à une durée de huit secondes, alors que les abonnés à ChatGPT Pro peuvent créer des vidéos de 1080p d'une durée maximale de 20 secondes avec Sora.

    Voici l'annonce de Google :

    Nous annonçons de nouvelles versions de Veo et d'Imagen et présentons notre dernière expérience en matière de génération d'images : Whisk.

    En début d'année, nous avons présenté notre modèle de génération vidéo, Veo, et notre dernier modèle de génération d'images, Imagen 3. Depuis, il est passionnant de voir les gens donner vie à leurs idées avec l'aide de ces modèles : Les créateurs de YouTube explorent les possibilités créatives des arrière-plans vidéo pour leurs courts métrages YouTube, les entreprises clientes améliorent les flux de travail créatifs sur Vertex AI et les créatifs utilisent VideoFX et ImageFX pour raconter leurs histoires. En collaboration avec des cinéastes et des entreprises, nous continuons à développer et à faire évoluer ces technologies.

    Aujourd'hui, nous présentons un nouveau modèle vidéo, Veo 2, et la dernière version d'Imagen 3, qui permettent tous deux d'obtenir des résultats de pointe. Ces modèles sont désormais disponibles dans VideoFX, ImageFX et Whisk, notre nouvelle expérience Labs.

    Veo 2 : un modèle de pointe de génération de vidéo

    Veo 2 crée des vidéos d'une "incroyable qualité dans un large éventail de sujets et de styles". Lors de comparaisons directes effectuées par des évaluateurs humains, Veo 2 a obtenu des résultats à la pointe de la technologie par rapport aux principaux modèles.

    Il apporte une meilleure compréhension de la physique du monde réel et des nuances des mouvements et de l'expression humaine, ce qui contribue à améliorer le niveau de détail et le réalisme en général. Veo 2 comprend le langage unique de la cinématographie : demandez-lui un genre, spécifiez un objectif, suggérez des effets cinématographiques et Veo 2 s'en chargera - à des résolutions allant jusqu'au 4K, et pour des durées allant jusqu'à plusieurs minutes. Demandez un travelling en contre-plongée qui glisse au milieu d'une scène, ou un gros plan sur le visage d'une scientifique qui regarde dans son microscope, et Veo 2 le créera. Suggérez "objectif 18 mm" dans votre demande et Veo 2 saura créer le plan grand angle pour lequel cet objectif est connu, ou estompez l'arrière-plan et concentrez-vous sur votre sujet en ajoutant "faible profondeur de champ" dans votre demande.


    Alors que les modèles vidéo "hallucinent" souvent des détails indésirables - des doigts supplémentaires ou des objets inattendus, par exemple - Veo 2 les produit moins souvent, ce qui rend les résultats plus réalistes.

    Notre engagement en faveur de la sécurité et du développement responsable a guidé Veo 2. Nous avons été intentionnellement mesurés dans l'augmentation de la disponibilité de Veo, afin de pouvoir aider à identifier, comprendre et améliorer la qualité et la sécurité du modèle tout en le déployant lentement via VideoFX, YouTube et Vertex AI.

    Tout comme le reste de nos modèles de génération d'images et de vidéos, les sorties de Veo 2 incluent un filigrane SynthID invisible qui permet d'identifier qu'elles sont générées par l'IA, réduisant ainsi les risques de désinformation et d'attribution erronée.

    Aujourd'hui, nous intégrons les nouvelles fonctionnalités de Veo 2 à VideoFX, l'outil de génération de vidéos de Google Labs, et élargissons le nombre d'utilisateurs qui peuvent y accéder. Visitez Google Labs pour vous inscrire sur la liste d'attente. Nous prévoyons également d'étendre Veo 2 à YouTube Shorts et à d'autres produits l'année prochaine.

    Imagen 3 : un modèle de pointe de génération d'images

    Nous avons également amélioré notre modèle de génération d'images Imagen 3, qui génère désormais des images plus lumineuses et mieux composées. Il peut désormais restituer des styles artistiques plus variés avec une plus grande précision - du photoréalisme à l'impressionnisme, de l'abstrait à l'anime. Cette mise à niveau permet également de suivre plus fidèlement les instructions et de restituer des détails et des textures plus riches. Dans les comparaisons côte à côte des résultats obtenus par des évaluateurs humains et des principaux modèles de génération d'images, Imagen 3 a obtenu des résultats à la pointe de la technologie.

    À partir d'aujourd'hui, le dernier modèle Imagen 3 sera déployé à l'échelle mondiale dans ImageFX, notre outil de génération d'images des laboratoires Google, dans plus de 100 pays. Visitez ImageFX pour commencer.

    Nom : 3.jpg
Affichages : 4641
Taille : 46,4 Ko
    L'annonce de Veo 2 donnera plus de choix aux utilisateurs, mais le modèle de Google devrait également souffir des mêmes controverses que le modèle d'OpenAI. En effet, l'IA, et notamment Sora d'OpenAI a divisé l'environnement de la cinématographie. Si les acteurs, les scénaristes et les employés du cinéma se sont mis en grève contre l'utilisation de l'IA dans la création de contenu, les studios de cinéma ont augmenté leurs dépenses dans l'IA générative.

    Pour convaincre Hollywood que Sora n’entraînera pas la fin de la production cinématographique traditionnelle, mais plutôt son amélioration, Sam Altman et OpenAI a notamment organisé des réunions avec les principaux studios, Paramount, Universal et Warner Bros Discovery, afin de présenter sa technologie de génération vidéo Sora et de dissiper les craintes que le modèle d'intelligence artificielle ne nuise à l'industrie cinématographique. Reste maintenant à voir l'impact de ces nouveaux modèles de génération de vidéo par IA.

    Source : Google

    Et vous ?

    Pensez-vous que ce modèle de Google est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Google présente Veo, son modèle d'IA pour générer des vidéos haute définition, et Imagen 3, son modèle texte-image de haute qualité, ainsi que des enregistrements de démonstration créés avec Music AI Sandbox

    Les films seront-ils bientôt générés dans leur entièreté par IA ? Oui, selon l'acteur et investisseur technologique Ashton Kutcher qui estime que ce sera le cas après avoir passé Sora d'OpenAI au test

    Meta présente Movie Gen : une IA capable de créer des vidéos personnalisables et réalistes à partir d'une seule image, ou de modifier une vidéo existante, lui ajoutant des éléments visuels ou sonores

    George Lucas pense que l'intelligence artificielle dans le cinéma est inévitable, chercher à faire sans serait comme dire : « Je ne crois pas que ces voitures vont fonctionner. Restons-en aux chevaux. »
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 336
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 336
    Par défaut Google Deepmind présente la prochaine vague de modèles de médias d'IA générative : Imagen 4, Veo 3 et Lyria 2
    Google Deepmind écrase OpenAI Sora avec son générateur vidéo Veo 3 qui intègre l'audio, et annonce Imagen 4 et Lyria 2, ses nouveaux modèles multimédias génératifs Vertex AI

    Google a annoncé Veo 3, un générateur de vidéo par intelligence artificielle (IA) capable de créer et d'incorporer du son. Cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains de la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA les plus acharnés.

    En décembre 2024, OpenAI a lancé la version officielle de son programme de génération de vidéos par intelligence artificielle (IA) "Sora". Le programme intègre des messages écrits et crée des vidéos numériques d'une durée maximale de 20 secondes. Lors de l'annonce, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

    Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable". Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et est moins susceptible d'"halluciner" des détails indésirables.

    Le 21 mai 2025, Google a annoncé son dernier modèle de génération de vidéos par IA, "Veo 3", qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

    "Veo 3 excelle dans les domaines du texte et de l'image, de la physique du monde réel et de la synchronisation labiale précise", a déclaré Eli Collins, vice-président produit de Google DeepMind. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains à la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA. Veo 3 sera également disponible pour les utilisateurs de la plateforme d'entreprise Vertex AI de Google.


    Google a également annoncé Imagen 4, son dernier outil de génération d'images, qui, selon l'entreprise, produit des images de meilleure qualité grâce à des invites de l'utilisateur. En outre, Google a dévoilé Flow, un nouvel outil de réalisation de films qui permet aux utilisateurs de créer des vidéos cinématographiques en décrivant les lieux, les plans et les préférences de style. Les utilisateurs peuvent accéder à cet outil via Gemini, Whisk, Vertex AI et Workspace.

    Les derniers lancements interviennent alors que l'imagerie et la vidéo deviennent des cas d'utilisation populaires pour les invites d'IA générative. En mars, Sam Altman, PDG d'OpenAI, a déclaré que le générateur d'images 4o de ChatGPT était si populaire qu'il avait fait "fondre" les puces GPU de l'entreprise. L'entreprise a déclaré qu'elle avait dû limiter temporairement l'utilisation de cette fonction.

    Google a un bilan mitigé en ce qui concerne ses générateurs d'images IA. En 2024, l'entreprise a dû relancer son outil Imagen 3 après avoir obtenu des résultats historiquement inexacts aux demandes des utilisateurs, ce qui a suscité de nombreuses critiques. Le cofondateur Sergey Brin a déclaré par la suite que cette mésaventure était due à un manque de "tests approfondis".

    Le géant technologique a également mis à jour son générateur de vidéos Veo 2 pour permettre aux utilisateurs d'ajouter ou de supprimer des objets dans les vidéos à l'aide d'invites textuelles. En outre, Google a ouvert son modèle de génération de musique Lyria 2 aux créateurs via sa plateforme YouTube Shorts et aux entreprises utilisant Vertex AI.

    Nom : 1.jpg
Affichages : 4818
Taille : 36,5 Ko

    Citation Envoyé par Google
    Aujourd'hui, nous présentons la prochaine vague de modèles de médias d'IA générative sur Vertex AI : Imagen 4, Veo 3 et Lyria 2.

    Nous avons déjà vu des clients générer des images étonnantes et photoréalistes avec Imagen 3, le modèle de génération d'images de Google. Les clients ont pris ces images et les ont transformées en vidéos et en ressources de haute qualité avec Veo 2. Nous avons même vu des clients prendre ces vidéos remarquables et leur donner vie avec un son de qualité professionnelle grâce à Lyria, le modèle avancé de génération de musique par l'IA de Google.

    Avec une montée en puissance de l'espace média génératif de l'IA dans le marketing, les médias et plus encore, la narration n'a jamais été aussi facile. Les utilisateurs créent plus rapidement des éléments de campagne et élaborent des contenus créatifs révolutionnaires. Jetons un coup d'œil à chaque modèle et aux façons dont vous pouvez commencer dès aujourd'hui.
    Présentation de Veo 3

    Veo 3 est le dernier modèle de génération vidéo de Google DeepMind. Google affirme que Veo 3 peut générer des vidéos avec :

    • Une qualité améliorée lors de la génération de vidéos à partir d'invites textuelles et d'images.
    • De la parole, comme des dialogues et des voix off
    • De l'audio, comme de la musique et des effets sonores.

    Voici quelques exemples :

    • Invite : Un plan moyen, un cadre d'aventure historique : La lumière chaude d'une lampe éclaire un cartographe dans un bureau encombré, en train d'étudier une carte ancienne et tentaculaire étalée sur une grande table. Cartographe : « D'après cette vieille carte marine, l'île perdue n'est pas un mythe ! Nous devons préparer une expédition immédiatement ! »


    • Invite : Un plan en contre-plongée montre une porte violette claire ouverte menant d'une pièce aux murs violets clairs et au sol gris à une scène extérieure animée. De l'herbe verte luxuriante et des fleurs sauvages se répandent de la porte sur le sol intérieur, créant une transition fantaisiste entre les espaces. Au-delà de la porte, des collines verdoyantes parsemées de fleurs sauvages s'étendent vers un ciel clair et lumineux. Un seul arbre se dresse au premier plan de la scène extérieure, ses feuilles ajoutant de la profondeur à la vue. La lumière du soleil et les éléments naturels contrastent avec la simplicité de l'espace intérieur, invitant à l'émerveillement et à l'évasion.


    Pour l'instant, Veo 3 est en avant-première privée sur Vertex AI et ne sera disponible plus largement que dans les semaines à venir.

    Voici quelques retours d'entreprises qui ont pu tester Veo 3 :

    Citation Envoyé par David Sandström, directeur marketing, Klarna
    Chez Klarna, nous cherchons constamment à repousser les limites de l'innovation dans nos efforts de marketing, et Veo a changé la donne dans nos flux de travail créatifs. Avec Veo et Imagen, nous avons transformé des processus de production qui prenaient beaucoup de temps en tâches rapides et efficaces qui nous permettent d'augmenter rapidement la création de contenu. Qu'il s'agisse de produire des b-rolls engageants, de concevoir des bumpers YouTube accrocheurs ou de développer des animations dynamiques sur les réseaux sociaux, ces outils ont permis à nos équipes d'être plus agiles et plus créatives. Les résultats parlent d'eux-mêmes, avec une augmentation de l'engagement et de la performance du contenu. Avec Google Cloud, nous jetons les bases de l'avenir du commerce et révolutionnons la manière dont nous donnons vie à notre marque.
    Citation Envoyé par David Jones, fondateur et PDG, Brandtech
    L'ajout de Veo 2 dans Pencil renforce notre engagement à doter les marketeurs d'une IA sophistiquée, leur permettant de produire des campagnes non seulement plus intelligentes et plus rapides, mais aussi plus audacieuses et plus inspirées sur le plan artistique. Nos projets pilotes ont donné des résultats incroyables, avec une réduction moyenne de 50 % des coûts et des délais de mise sur le marché. Ce changement radical en matière de contrôle et de qualité permet de transformer en quelques minutes des idées auparavant impossibles à concrétiser en un véritable contenu marketing. Japan Airlines montre la voie en appliquant Gen AI à l'industrie du voyage, et nous sommes impatients de voir comment d'autres marques suivront le mouvement.
    Citation Envoyé par Justin Thomas, responsable de l'expérience numérique et de la croissance, Kraft Heinz
    Avec Veo et Imagen sur Vertex AI dans le cadre de notre plateforme Tastemaker, Kraft Heinz a débloqué une vitesse et une efficacité sans précédent dans nos flux de travail créatifs. Ce qui nous prenait auparavant huit semaines ne prend plus que huit heures, ce qui se traduit par des économies substantielles.
    Citation Envoyé par Aaron Rutley, chef de produit pour l'IA chez Envato.
    Nous avons essayé plusieurs des meilleurs modèles vidéo, et Veo 2 a donné les résultats les plus impressionnants en termes de vitesse et de qualité sur un ensemble varié de textes et d'images. Dès les premiers jours du lancement, des dizaines de milliers d'abonnés d'Envato accédaient déjà à VideoGen, et près de 60 % des vidéos générées étaient téléchargées pour être utilisées dans des projets créatifs. Depuis mars, Envato a vu l'utilisation de VideoGen dépasser les 100 % mois après mois. Ce fut un plaisir de travailler avec Google Cloud pour donner vie à la fonctionnalité VideoGen d'Envato avec Veo.

    Présentation d'Imagen 4

    Présenté en avant-première publique, Imagen 4 est le dernier modèle de génération d'images de haute qualité de Google. L'entreprise affirme que Imagen 4 est capable de :

    • Rendu de texte exceptionnel et adhérence rapide
    • Qualité d'image globale supérieure dans tous les styles
    • Prise en charge multilingue des invites pour aider les créateurs dans le monde entier

    Voici quelques exemples :

    • Invite : Capturez un gros plan intime baigné par la lumière chaude et douce du soleil de fin d'après-midi qui filtre dans une cuisine typique des années 1960. Le point de mire est un emballage vintage de farine tout usage au design charmant, posé sur un comptoir en Formica moucheté. L'emballage lui-même évoque la nostalgie à l'état pur : peut-être un papier épais et légèrement texturé dans un ton crème chaud, orné d'une typographie simple et audacieuse (un empattement ou une écriture sympathique) en rouge et bleu classique « FARINE TOUT USAGE », avec une charmante illustration comme une gerbe de blé stylisée ou un joyeux personnage de boulanger. En caractères gras plus petits, au bas de l'emballage : « NET WT 5 LBS (80 OZ) 2.27kg ». Concentrez-vous sur les détails de l'emballage - les bords légèrement souples du sac en papier, la texture de l'impression vintage, le texte invitant « Farine tout usage ». De subtils indices de la cuisine des années 1960 encadrent la prise de vue - le bord chromé du comptoir qui brille doucement, un aperçu flou du dosseret en céramique jaune pastel, ou le coin d'une boîte métallique vintage placée juste en dehors du champ. La faible profondeur de champ maintient l'attention sur l'emballage magnifiquement conçu, créant une esthétique riche en chaleur, en authenticité et en attrait nostalgique.

      Nom : 2.jpg
Affichages : 1034
Taille : 49,8 Ko

    • Invite : Cette bande dessinée de quatre planches utilise un style artistique charmant et délibérément pixellisé qui rappelle les jeux vidéo 8 bits classiques, avec des formes simples et une palette de couleurs limitée et lumineuse dominée par les verts, les bleus, les bruns et le gris/noir emblématique du dinosaure. Le décor est une plage de pixels stylisée. Le premier panneau montre le dinosaure T-Rex de Google Chrome, avec sa forme pixellisée caractéristique, portant de minuscules lunettes de soleil pixellisées et se prélassant sur une serviette de plage pixellisée sous un soleil jaune pâle. Des palmiers pixellisés se balancent doucement à l'arrière-plan, dans un ciel bleu pixellisé. Une légende en caractères pixelisés indique : « Même les messages d'erreur ont besoin de vacances ». La deuxième planche est un gros plan du T-Rex qui tente de construire un château de sable en pixels. Il tapote maladroitement un monticule de pixels bruns avec ses minuscules bras de pixels, l'air concentré. De petits coquillages pixellisés parsèment le sable autour de lui. La troisième image montre le T-Rex sautant joyeusement par-dessus une série de cactus pixellisés plantés près de la plage, imitant ainsi son jeu d'évitement d'obstacles. Un petit effet sonore « Boing ! Boing ! » s'affiche dans une police de caractères en bloc au-dessus de chaque saut. Un crabe pixellisé observe la scène de côté, en agitant sa pince pixellisée. Le dernier panneau montre le T-Rex flottant paisiblement sur le dos dans l'eau de pixels bleus, les lunettes de soleil toujours en place, avec une expression satisfaite. Une petite bulle de pensée au-dessus de lui contient des « Zzz... » pixellisés indiquant la relaxation.

      Nom : 3.jpg
Affichages : 1037
Taille : 78,9 Ko

    Pour commencer à utiliser Imagen 4 en avant-première publique sur Vertex AI, vous pouvez utiliser Media Studio ou exécuter l'exemple de code suivant, qui utilise le SDK Google Gen AI pour Python.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    from google import genai
     
    # TODO(developer): Update and un-comment below lines
    # project_id = "PROJECT_ID"
    client = genai.Client(vertexai=True, project=project_id, location="us-central1")
     
    prompt = """
    A white wall with two Art Deco travel posters mounted. First poster has the text: "NEPTUNE", tagline: "The jewel of the solar system!' Second poster has the text: "JUPITER", tagline: "Travel with the giants!
    """
     
    image = client.models.generate_images(
       model="imagen-4.0-generate-preview-05-20",
       prompt=prompt,
    )
     
    # OPTIONAL: View the generated image in a notebook
    # image.generated_images[0].image.show()

    Présentation de Lyria 2

    Lors de la conférence Google Cloud Next 2025, Google a annoncé Lyria dans Vertex AI, le modèle de conversion de texte en musique de Google. Récemment, Google annonce la disponibilité générale de Lyria 2 dans Vertex AI. Google affirme que Lyria 2 offre une musique de haute fidélité dans un large éventail de styles et permet :

    • un contenu audio de haute qualité à partir d'invites textuelles
    • un plus grand contrôle créatif sur les instruments, le BPM et d'autres caractéristiques

    Voici quelques exemples :

    • Invite : Cumbia péruvienne rythmée et entraînante avec un côté psychédélique, LA, performance en direct lors d'un festival de musique latine, incorporant des guitares électriques, des basses et utilisant souvent une section de percussions timbales proéminentes, créant une ambiance puissante et dansante. Vibrant et énergique.


    • Invite : Musique orchestrale de film, enregistrement en studio, Londres, orchestre de 100 musiciens, majestueux et profond. Mélange de mélodies planantes, de changements harmoniques dramatiques et d'éléments percussifs puissants, avec des instruments tels que des cors, des cordes et des timbales, et une approche thématique, avec des orchestrations complexes, une gamme dynamique et une profondeur émotionnelle, évoquant une atmosphère cinématographique et impressionnante.


    Pour commencer à créer du contenu avec Lyria 2, consultez Media Studio sur Vertex AI. Une fois sur place, vous pouvez commencer à générer de la musique à partir d'invites textuelles ou accéder à l'API du modèle via Vertex AI.

    Voici quelques retours d'entreprises qui ont pu tester Lyria 2 :

    Citation Envoyé par Dwight Churchill, cofondateur et directeur de l'exploitation de Captions.ai
    Chez Captions, notre fonction Mirage Edit permet déjà aux abonnés de passer d'un message à une vidéo parlante AI entièrement éditée - avec des images, des clips B-roll, des voix off et des transitions. Aujourd'hui, nous ajoutons un élément clé : la musique adaptative alimentée par Lyria 2 de Google. D'un simple clic, Lyria compose une musique qui se synchronise avec le scénario, le rythme et les transitions à chaque moment émotionnel, de sorte que nos clients peuvent publier des vidéos cinématiques de courte durée sans jamais quitter Captions ou parcourir des bibliothèques de stock.
    Citation Envoyé par Soumyadeep Mukherjee, directeur technique de Dashverse
    Nous avons toujours cru en l'autonomisation des créateurs quotidiens chez Dashverse - qu'ils réalisent des bandes dessinées avec Dashtoon ou des courts métrages sur DashReels. Notre passage à la narration dynamique et émotionnelle avec DashReels nécessitait un moteur musical tout aussi expressif et réactif. Lyria 2 sur Vertex AI offre exactement cela. Il permet à nos utilisateurs de contrôler la musique comme dans un studio, en l'adaptant aux émotions, à la scène et au rythme, sans les frais généraux. Il ne s'agit pas seulement d'un générateur de bande sonore, mais d'un amplificateur de narration. Nous sommes très enthousiastes à l'idée de ce que cela va apporter à la prochaine génération de créateurs natifs de l'IA
    Politiques de sécurité de Google

    La sécurité et la sûreté de tout contenu généré par l'IA sont cruciales. C'est pourquoi les modèles doivent être conçus avec des protections intégrées, vous permettant de vous concentrer sur votre travail créatif. Selon Google, Veo 3, Imagen 4 et Lyria 2 sont tous construits avec la sécurité comme principe de conception fondamental en partenariat avec Google DeepMind.

    • Filigrane : Par défaut, toutes les créations générées avec Veo, Imagen et Lyria utilisent SynthID, une technologie qui intègre un filigrane invisible directement dans le résultat généré. Ce filigrane permet d'identifier les médias générés par l'IA, garantissant ainsi la transparence.

    • Filtres de sécurité : Les invites d'entrée et le contenu de sortie de tous les modèles de médias générés par l'IA sont accessibles à l'aide d'une liste de filtres de sécurité. En étant en mesure de configurer le degré d'agressivité du filtrage du contenu, vous pouvez vous assurer que les ressources respectent les valeurs de votre marque. Dans les données visuelles de sortie, vous avez également le contrôle sur la génération des personnes.


    Et vous ?

    Pensez-vous que ces nouveaux modèles sont crédibles ou pertinents ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Les vidéos de deepfake deviennent étonnamment bonnes : l'IA chinoise OmniHuman-1 peut générer les vidéos de deepfake les plus réalistes à ce jour, parlant, chantant et bougeant, à partir d'une seule photo

    Meta présente Movie Gen : une IA capable de créer des vidéos personnalisables et réalistes à partir d'une seule image, ou de modifier une vidéo existante, lui ajoutant des éléments visuels ou sonores

    La société d'IA OpenAI a lancé le programme de génération de vidéos Sora à l'intention de ses clients, qui est capable de créer des vidéos numériques d'une durée maximale de 20 secondes
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #3
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    9 491
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 9 491
    Par défaut Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus
    Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube
    quelques heures seulement après sa présentation durant la Google I/O

    Lors de la conférence Google I/O, la firme de Mountain View a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle. Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.

    En décembre 2024, OpenAI a lancé en disponibilité générale Sora, son programme de génération de vidéos par intelligence artificielle. L'utilisateur note en langage naturel ce qu'il veut obtenir comme résultat vidéo et Sora génère jusqu'à 20 secondes de vidéos.

    Lors de l'annonce de la disponibilité, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

    Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle qui s'appuie sur le Veo original et crée des « vidéos d'une qualité incroyable ». Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des « clips vidéos de quelques minutes » dans des résolutions 4k et est moins susceptible « d'halluciner » des détails indésirables.

    Veo 3 : une prouesse technologique

    Lors de l'édition 2025 de la conférence Google dédiée aux développeurs, Google a présenté son dernier modèle de génération de vidéos par IA, Veo 3, qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

    Citation Envoyé par Google
    Veo génère des vidéos de haute qualité à une résolution de 1080p qui peuvent dépasser une minute, dans une grande variété de styles cinématographiques et visuels. Grâce à une compréhension avancée du langage naturel et de la sémantique visuelle, il peut générer des vidéos qui représentent fidèlement la vision créative de l'utilisateur, en captant avec précision le ton d'une invite et en restituant les détails dans les invites plus longues.

    Le modèle comprend également les termes cinématographiques tels que "timelapse" ou "plans aériens d'un paysage", offrant un niveau de contrôle créatif sans précédent. Et il crée des séquences cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des plans.
    « Veo 3 excelle dans les domaines du texte et de l'image, de la physique du monde réel et de la synchronisation labiale précise », a déclaré Eli Collins, vice-président produit de Google DeepMind. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains à la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA. Veo 3 sera également disponible pour les utilisateurs de la plateforme d'entreprise Vertex AI de Google.


    Une explosion de contenus générés par IA

    Depuis son lancement, Veo 3 a été utilisé pour créer une multitude de vidéos virales sur YouTube et X, allant de sketchs humoristiques à des simulations de jeux vidéo. Par exemple, une vidéo générée par Veo 3 montre un faux unboxing d'iPhone, si réaliste qu'il est difficile de distinguer la fiction de la réalité. D'autres clips présentent des interviews de rue fictives ou des sessions de jeu "Fortnite" entièrement simulées. Ces contenus, bien que divertissants, soulèvent des préoccupations quant à la frontière entre réalité et fiction sur les plateformes numériques.

    Ci-dessous par exemple, nous avons une vidéo générée par Veo 3 d'un standup

    Celle-ci d'une sitcom qui n'a jamais existé

    Une séquence d'un film qui n'existe pas

    Ou d'une conférence technologique qui n'a jamais eu lieu

    Google Veo 3 permet de créer des vidéos de chant et de musique à partir d'une simple invite.

    Vidéo de Will Smith mangeant des spaghettis générée par Veo 3

    Chaque fois qu'une entreprise dévoile un nouvel outil de génération de vidéos par l'IA, il se produit un rituel désormais familier : quelqu'un crée une vidéo de l'acteur Will Smith en train de manger des spaghettis. Ce qui n'était au départ qu'un mème s'est transformé en une référence originale pour tester le réalisme et les capacités des vidéos générées par l'IA. Le scénario bizarre (Smith mangeant des nouilles) est devenu un test décisif pour savoir dans quelle mesure un modèle peut gérer les expressions faciales, les mouvements des mains et les textures désordonnées comme la nourriture.

    Avec le lancement de Veo 3 aux États-Unis, les utilisateurs ont rapidement mis à l'épreuve le nouvel outil vidéo IA de Google en générant de nouvelles vidéos de Will Smith mangeant des spaghettis. Jetez un coup d'œil à la vidéo partagée par Javi Lopez, un utilisateur de X.

    Cette vidéo a été faite en 2023 avec Veo 2. Un bon point de départ pour faire des comparaisons sur l'évolution de l'outil de Google.

    S'il fallait rester sur le mème et non sur l'outil, voici des vidéos de 2023 de Smith mangeant des spaghettis.


    Les vidéos de 2023 ont été critiquées pour leur manque de réalisme, les mouvements peu naturels et des artefacts visuels qui montrent clairement qu'elles ont été générées par une IA. En revanche, la vidéo générée par Veo 3 présente un niveau de fidélité visuelle nettement supérieur. Les textures, l'éclairage et les détails des spaghettis, de la fourchette et des expressions faciales de Will Smith sont rendus avec une grande précision, montrant des changements subtils qui traduisent l'émotion et la réaction.

    Quand Will Smith est entré dans la danse

    Le mème est devenu si répandu que même Will Smith l'a reconnu. En février dernier, l'acteur a publié sur Instagram une parodie humoristique de la tendance, alimentant ainsi sa popularité et consolidant sa place dans la culture Internet.

    « C'est devenu incontrôlable ! » a-t-il mis en légende de sa publication.

    Nom : will.png
Affichages : 8475
Taille : 263,8 Ko

    Vers une régulation nécessaire ?

    L'intégration de Veo 3 dans YouTube Shorts permet aux créateurs de générer des vidéos de 6 secondes à partir de simples descriptions textuelles. Bien que cette fonctionnalité offre de nouvelles opportunités créatives, elle pose également des défis en matière de modération et de véracité des contenus.

    Pour garantir la transparence dans l’utilisation de l’IA, toutes les vidéos créées avec Veo sont marquées d’un filigrane SynthID, développé par Google DeepMind également. Ce filigrane authentifie les vidéos générées par l’IA et empêche toute manipulation indétectable, offrant ainsi une couche de sécurité supplémentaire dans la lutte contre la désinformation visuelle.

    La facilité avec laquelle Veo 3 peut produire des vidéos réalistes soulève des questions sur la nécessité d'une régulation plus stricte des contenus générés par IA. Si des outils comme SynthID sont un pas dans la bonne direction, ils ne suffisent pas à eux seuls à garantir l'authenticité des informations diffusées. Il est essentiel que les plateformes, les développeurs et les régulateurs collaborent pour établir des normes claires et protéger les utilisateurs contre les contenus trompeurs.

    Conclusion

    Veo 3 représente une avancée majeure dans le domaine de la génération de vidéos par intelligence artificielle, offrant des possibilités créatives inédites. Cependant, son utilisation massive sur des plateformes comme YouTube met en lumière les défis liés à la véracité des contenus et à la protection des utilisateurs. Il est impératif d'adopter une approche équilibrée, combinant innovation technologique et responsabilité éthique, pour tirer le meilleur parti de ces outils tout en minimisant leurs risques potentiels.

    Sources : Google, vidéos dans le texte, Will Smith

    Et vous ?

    Que pensez-vous des performances de Veo 3 ? Des vidéos générées par l'outil de Google, laquelle / lesquelles vous a / ont le plus intéressé(s) / impressionné(s) ?

    Veo 3 représente-t-il une avancée ou une menace pour la création audiovisuelle traditionnelle ?

    À quel point peut-on encore parler de "création" lorsque tout est généré à partir d'une simple description textuelle ?

    La qualité des vidéos générées par IA surpassera-t-elle bientôt celle des contenus réalisés par des humains ?

    Les créateurs humains risquent-ils d’être marginalisés ou remplacés par les IA sur les plateformes comme YouTube ?

    Une IA peut-elle créer du contenu vraiment original, ou ne fait-elle que recycler des patterns existants ?

    Quels métiers émergeront avec la généralisation de ces outils ? Les monteurs vidéo ou scénaristes IA seront-ils les "nouveaux créateurs" ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  4. #4
    Chroniqueur Actualités
    Avatar de Anthony
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Novembre 2022
    Messages
    1 686
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Novembre 2022
    Messages : 1 686
    Par défaut Google aurait formé ses modèles d'IA Veo 3 et Gemini à partir du contenu des utilisateurs sur YouTube
    Avec des milliards de vidéos YouTube à sa disposition, Google aurait formé les modèles d'IA Veo 3 et Gemini à partir du contenu des utilisateurs sans leur consentement, leur approbation ou leur rémunération

    Google aurait utilisé du contenu YouTube pour entraîner ses modèles d'intelligence artificielle (IA), notamment Gemini et le générateur de vidéo et d'audio Veo 3, selon un rapport de CNBC.

    Pour rappel, Google DeepMind a lancé Veo 3, un modèle d'IA générative capable de produire des vidéos avec du son intégré, en mai dernier. Veo 3 se positionne comme un concurrent direct de Sora d'OpenAI, mais sa capacité à intégrer du son dans les vidéos qu'il crée constitue un atout majeur. L'outil fait partie de la suite plus large de technologies d'IA multimédia de Google, aux côtés d'Imagen 4 et Lyria 2, les nouveaux modèles multimédias génératifs de Vertex AI.

    Selon le rapport de CNBC, un porte-parole de YouTube a confirmé que Google s'appuyait sur sa banque de vidéos YouTube pour entraîner ses modèles d'IA. Cependant, le porte-parole a ajouté que Google n'utilise pas toutes les vidéos disponibles sur YouTube, mais seulement une partie d'entre elles à des fins d'entraînement.

    Le rapport affirme en outre que de nombreux créateurs dont les vidéos auraient pu être utilisées à cette fin ignorent que leur contenu a été utilisé sans leur consentement et sans aucune compensation.


    Les créateurs n'ont jamais été informés ?

    Selon YouTube, cette information a déjà été communiquée aux créateurs, mais, d'après les experts interrogés par CNBC, les créateurs et les entreprises médiatiques ne comprennent pas bien que le géant américain de la technologie entraîne ses modèles d'IA à l'aide de sa vidéothèque (YouTube).

    Au début de l'année dernière, en septembre, YouTube a déclaré dans un blog que le contenu téléchargé sur la plateforme pouvait être utilisé pour « améliorer l'expérience produit... notamment grâce à l'apprentissage automatique et aux applications d'IA ». Un inconvénient majeur réside dans le fait que les créateurs qui ont mis en ligne des vidéos sur YouTube n'ont aucun moyen de refuser que Google les utilise pour entraîner ses modèles d'IA, ce que proposent ses concurrents, comme Meta. Étonnamment, YouTube permet aux créateurs de refuser que leur contenu soit partagé avec des sociétés tierces pour entraîner leurs modèles d'IA.

    Selon YouTube, la plateforme compte environ 20 milliards de vidéos, mais on ne sait pas pour l'instant combien d'entre elles sont utilisées pour entraîner les modèles d'IA de Google. CNBC a cité des experts qui affirment que même si Google n'utilisait qu'un pour cent de ces vidéos, cela représenterait environ 2,3 milliards de minutes de contenu, soit 40 fois plus que les données d'entraînement utilisées par les modèles d'IA concurrents.

    Le rapport affirme que CNBC s'est entretenu avec un certain nombre de créateurs et de professionnels de la propriété intellectuelle de premier plan, et qu'il a découvert qu'aucun d'entre eux n'était apparemment au courant ou n'avait été informé par YouTube de la possibilité que leur contenu soit utilisé pour entraîner les modèles d'IA de Google.

    Pourquoi est-ce important ?

    YouTube, qui utilise des vidéos mises en ligne par les utilisateurs pour entraîner l'IA, a suscité des inquiétudes, en particulier après que Google a dévoilé son puissant générateur de vidéos Veo 3. Cet outil permet de créer des scènes cinématographiques entièrement générées par l'IA, y compris les images et le son. Avec environ 20 millions de vidéos mises en ligne quotidiennement sur YouTube par des créateurs et des entreprises médiatiques, certains craignent que leur contenu soit utilisé pour développer une technologie qui pourrait un jour les concurrencer ou les remplacer.

    CNBC a cité des experts affirmant que même si les résultats de Veo 3 ne copient pas directement le contenu existant, les résultats générés par l'IA peuvent alimenter des produits commerciaux susceptibles de rivaliser avec les créateurs mêmes dont le travail a contribué à l'entraîner, sans leur permission, sans mentionner leur nom et sans les rémunérer.

    Ce piège sans issue commence dès qu'un créateur télécharge une vidéo sur YouTube, car ce faisant, il accepte que YouTube dispose d'une licence étendue sur le contenu.

    Que montrent les antécédents ?

    Selon le New York Times, Google aurait transcrit des vidéos YouTube afin d'entraîner ses modèles d'IA. Mashable souligne que cette pratique soulève des questions juridiques, car elle pourrait enfreindre les droits d'auteur des créateurs.

    L'utilisation de contenus en ligne pour l'entraînement de l'IA a déjà donné lieu à des poursuites judiciaires liées aux licences et à la propriété intellectuelle. D'autres acteurs tels que Meta et OpenAI ont également été critiqués pour avoir utilisé la propriété intellectuelle afin d'entraîner leurs modèles d'IA sans le consentement des créateurs ou des auteurs.

    Il est intéressant de noter qu'à la suite de l'annonce de Veo 3 lors de la dernière conférence Google I/O, l'outil de génération de vidéos par IA a rapidement entraîné une explosion de contenus sur des plateformes comme X et YouTube. Capable de créer des scènes réalistes à partir de simples descriptions textuelles, intégrant des dialogues, de la musique et des effets sonores, Veo 3 suscite une inquiétude croissante quant à la prolifération de contenus générés par IA sur des plateformes comme YouTube.

    Ces développements rappellent la vidéo virale « Will Smith mangeant des spaghettis », autrefois tournée en dérision, mais qui est désormais considérée comme un critère de performance révélant les capacités de l'IA Veo 3 de Google, mais aussi ses limites. Initialement perçu comme une curiosité grotesque, le mème est devenu un symbole des avancées technologiques et des débats entourant l'IA.

    Source : CNBC

    Et vous ?

    Quel est votre avis sur le sujet ?
    Trouvez-vous cette initiative de Google crédible ou pertinente ?

    Voir aussi :

    Runway aurait formé son outil d'IA de génération de vidéo à partir de milliers de vidéos YouTube sans autorisation, YouTube indique qu'il s'agit d'une "violation claire" des règles de la plateforme

    Peak Points : YouTube utilise l'IA Gemini pour insérer des pubs aux moments où l'attention des spectateurs est la plus forte, quand ils sont potentiellement plus réceptifs à un message publicitaire

    Les créateurs de vidéos YouTube sont désormais tenus d'indiquer si les vidéos réalistes ont été réalisées à l'aide d'une IA, afin d'éviter tout contenu susceptible d'induire les utilisateurs en erreur

    Le New York Times affirme qu'OpenAI a transcrit plus d'un million d'heures de vidéos YouTube pour entraîner son modèle d'IA GPT-4, violant ainsi les droits d'auteur des créateurs de la plateforme
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  5. #5
    Chroniqueur Actualités

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Juin 2023
    Messages
    1 406
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Bénin

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2023
    Messages : 1 406
    Par défaut TikTok est inondé de vidéos à caractère raciste et antisémite créées à l'aide de l'outil Veo 3 de Google
    TikTok est inondé de vidéos à caractère raciste et antisémite créées à l'aide de l'outil d'IA de génération de vidéo Veo 3 de Google
    les garde-fous mis en place par Google et TikTok se révèlent inefficaces

    La sortie de Veo 3 Google a marqué une avancée significative dans la génération de vidéo par l'IA. Seulement quelques heures après son lancement, Veo 3 avait entraîné une explosion de contenus sur des plateformes telles que X (ex-Twitter) et YouTube. Aujourd'hui, des utilisateurs de TikTok inondent la plateforme avec des vidéos illustrant des thèmes racistes et antisémites réalisées avec Veo 3. Ils publient également des vidéos trompeuses d'immigrants et de manifestants générées par l'IA. Les vidéos sont devenues virales, avec des millions de visionnages, ce qui suscite des préoccupations quant à la capacité de l'IA à renforcer les stéréotypes existants.

    Google a lancé Veo 3 le 20 mai 2025 lors de sa conférence annuelle I/O. Veo 3 est un générateur de vidéos courtes (environ 8 secondes). Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par l'IA sur des plateformes de médias sociaux et leurs impacts sur la société.

    Media Matters for America (Media Matters) a détecté des vidéos haineuses sur TikTok utilisant cet outil, repérées grâce au filigrane « Veo » dans un coin, à des hashtags ou noms d’utilisateur évoquant « Veo 3 » ou « IA », ainsi qu’à des signes de génération automatique (distorsions, textes incohérents).

    Selon Media Matters, les vidéos identifiées reprennent des clichés racistes, notamment en décrivant les Noirs comme des singes et des criminels et en les représentant avec des pastèques et du poulet frit. Et dans un cauchemar particulièrement dystopique, certaines vidéos générées par l'IA reconstituent les traumatismes historiques des groupes marginalisés, décrivant des camps de concentration et des attaques du Ku Klux Klan contre des Noirs américains.

    Quand l'IA facilite la diffusion des clichés racistes et antisémites

    La plupart des propos virulents générés par l'IA visent les Noirs, les décrivant comme « les suspects habituels » dans les crimes, des parents absents et des singes qui aiment les pastèques. Le contenu vise également les immigrants et les Juifs. Les vidéos durent au maximum huit secondes ; Media Matters a également identifié des compilations de plusieurs clips ne durant pas plus de 8 secondes. « Il s'agit d'une utilisation très grave de l'IA », note un critique.


    Par exemple, une vidéo est intitulée « Average Waffle House in Atlanta » et montre un restaurant rempli de singes. Une voiture percute la porte d'entrée du restaurant et cinq singes sautent du véhicule en tenant des seaux de poulet frit de type KFC remplis de pastèques. La vidéo montre ensuite des singes se déchaînant dans le restaurant, lançant des pastèques et transportant des seaux de poulet frit. Ce clip avait été visionné un peu plus de 600 000 fois.

    La compilation vidéo ci-dessous contient des exemples tirés de TikTok depuis la sortie de Veo 3, mais attention, elle contient du contenu raciste et antisémite. Certaines vidéos sont choquantes, ce qui est probablement le but : rien ne stimule autant l'engagement sur les médias sociaux que la colère et le drame. Media Matters ajoute que les publications originales ont suscité un torrent de commentaires reprenant les stéréotypes utilisés dans la vidéo.

    Certaines des vidéos mises en avant par Media Matters sont également disponibles sur YouTube et Instagram, mais avec moins de vues. D'autres vidéos trouvées par Media Matters contiennent des propos antisémites et des représentations racistes des immigrants et des personnes d'origine asiatique.

    Une vidéo virale (14,2 millions de vues) montre deux policiers blancs mangeant des beignets. Puis l'un d'eux dit : « regardez ! un Noir ! » et tire plusieurs fois sur son arme. Dans une autre vidéo, avec 2,1 millions de vues, un policier blanc tient une canne à pêche avec une pastèque en guise d'appât et affirme : « mes chiffres sont bas cette semaine. Un homme doit faire ce qu'un homme doit faire », tandis qu'une femme noire s'approche de lui à quatre pattes.

    Des logiciels d'IA qui échappent au contrôle de leurs créateurs

    Google a mis l'accent sur la sécurité lors de l'annonce de son générateur de vidéo Veo 3 en mai dernier. Il arrive qu'un système d'IA refuse d'effectuer une tâche qui enfreigne ses règles. Et ce n'est jamais agréable lorsque vos intentions sont véritablement inoffensives, mais que le système génère un faux positif et bloque la génération du contenu. Google a généralement trouvé le bon équilibre jusqu'à présent, mais il semble que Veo 3 soit plus permissif.

    Nom : IMG_CA3DDF350C44-1.jpeg
Affichages : 12407
Taille : 29,7 Ko

    Certains utilisateurs affirment avoir testé de simples prompts (instruction générative) avec Veo 3 et constaté qu'il était facile de reproduire des éléments des vidéos signalées par Media Matters. Cela signifie que les utilisateurs trouvent facilement des astuces pour contourner les garde-fous de ces outils d'IA.

    Les conditions d'utilisation de TikTok interdisent les contenus de ce type. « Nous n'autorisons aucun discours haineux, comportement haineux ou promotion d'idéologies haineuses. Cela inclut les contenus explicites ou implicites qui attaquent un groupe protégé », stipulent les directives communautaires. Malgré cette interdiction générale des caricatures racistes, les vidéos haineuses de Veo 3 semblent se propager sans aucun contrôle.

    TikTok précise qu'il utilise à la fois la technologie et des modérateurs humains pour identifier les contenus qui enfreignent les règles. Mais le volume des publications rend difficile une modération en temps réel. Un porte-parole de TikTok a déclaré que plus de la moitié des comptes signalés dans le rapport de Media Matters avaient été bannis de la plateforme pour violation des règles avant la publication du rapport, et que les autres désormais été supprimés.

    Dans le même temps, Google prévoit d'intégrer Veo 3 à YouTube Shorts, ce qui pourrait faciliter encore davantage la diffusion de contenus similaires sur la plateforme. Selon le PDG de YouTube, Neal Mohan, l'intégration de Veo 3 à Shorts ouvrira une nouvelle ère pour les créateurs. Mais des critiques émergent, certains affirmant que cette fonctionnalité rend la création de contenu si automatique qu’elle en devient industrielle, impersonnelle et médiocre.

    Conclusion

    L'IA générative facilite la création et la diffusion à grande échelle de contenus reprenant des clichés racistes et antisémites. TikTok et Google ont clairement interdit ce type de contenu, ce qui aurait dû empêcher leur diffusion. Cependant, ces politiques ne sont pas suffisamment appliquées. TikTok semble incapable de faire face au flot de vidéos mises en ligne, et les garde-fous de Google semblent insuffisants pour bloquer la création de ce type de contenu.

    Depuis que l'IA générative existe, les gens l'utilisent pour créer des contenus provocateurs. Google et ses rivaux élaborent des garde-fous pour empêcher les abus, mais ils ne peuvent pas tout détecter. Le réalisme de Veo 3 le rend particulièrement attrayant pour ceux qui veulent répandre des stéréotypes haineux.

    L'IA générative a aussi inauguré l'ère des « fake bands », c'est-à-dire des entités musicales fictives générées par de grands modèles de langage (LLM), qui prolifèrent aujourd’hui sur les plateformes de streaming comme YouTube et Spotify. Si certains enthousiastes saluent une nouvelle frontière créative, des critiques issues de l'industrie musicale y voient une menace pour les artistes réels, l’authenticité musicale et la viabilité des systèmes de rémunération établis.

    Source : Media Matters

    Et vous ?

    Quel est votre avis sur le sujet ?
    Que pensez-vous de la prolifération rapide des contenus racistes et antisémites en ligne à l'ère de l'IA ?
    Comment lutter contre les abus des outils d'IA générative ? Quels impacts ces abus pourraient-ils avoir sur la société ?
    Les garde-fous élaborés par les créateurs de ces outils semblent inefficaces contre les abus. Qu'en pensez-vous ?

    Voir aussi

    Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube, quelques heures seulement après sa présentation durant la Google I/O/

    Avec des milliards de vidéos YouTube à sa disposition, Google aurait formé les modèles d'IA Veo 3 et Gemini à partir du contenu des utilisateurs sans leur connaissance, leur approbation ou rémunération

    YouTube Shorts va intégrer l'outil Veo 3 de Google pour permettre aux créateurs de générer des vidéos courtes à partir de rien grâce à l'IA, mais les utilisateurs craignent un déluge de contenus sans qualité

  6. #6
    Membre éprouvé
    Avatar de calvaire
    Homme Profil pro
    .
    Inscrit en
    Octobre 2019
    Messages
    2 038
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Singapour

    Informations professionnelles :
    Activité : .
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2019
    Messages : 2 038
    Par défaut
    je trouve pas la vidéo raciste mais c'est de l'humour qui m'a bien faire rigolé.
    ca joue sur pleins de cliché, pas que les noirs, la grosse femme blanche américaine, les flics blanc qui tirent ou le chinois qui cuisine des chiens et les chats.

    et sans parler des scènes qui n'ont tellement aucun sens mais assez bien fait avec l'ia, c'est extrêmement drôle je trouve. De l'auto dérisions et de la parodie qui me rappelle la grande époque de Top Gear et l'humour de son présentateur de génie.

    Ça nous change de l'humour bien fade et pas drôle de certains humoriste et film comédie français. Qui d'ailleurs se base sur des clichés bien lessivé (l'homme blanc hétéro idiot/bête qui se fait marcher dessus par sa femme), l'homme qui se prends une gifle au cinema, jamais l'inverse, ou alors dans ce cas c'est mal, si l'homme se prends la beigne par contre c'est mérité et "drole".
    La France est un pays qui redistribue tout sauf de l'espoir.

  7. #7
    Membre actif
    Homme Profil pro
    Architecte réseau
    Inscrit en
    Mars 2025
    Messages
    46
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Architecte réseau
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2025
    Messages : 46
    Par défaut
    "Raciste" ... Faudrait déjà définir ce que ça signifie et qui décide de ce qui est "raciste" ou pas ...
    On voit depuis 30 ans le glissement de ce mot qui désormais sert à définir tout et n'importe quoi.

  8. #8
    Membre confirmé
    Profil pro
    Inscrit en
    Mars 2011
    Messages
    128
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2011
    Messages : 128
    Par défaut
    Quand bien même bytedance arriverait à filtrer, dès que la branche des usa sera rachetée, les vannes seront de nouveau ouvertes et autoriseront les contenus racistes. Car oui, les vidéos de cette compilation sont totalement racistes, il faut vraiment être fêlé pour dire le contraire et remettre en cause la définition du racisme.
    Et comme d'habitude, c'est toujours les mêmes racistes qui ne voient que de l'humour et qui veulent avoir le droit de juger de ce qui relève du racisme ou pas, selon leurs propres standards de racistes bien entendu.

  9. #9
    Membre extrêmement actif Avatar de OrthodoxWindows
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2021
    Messages
    1 327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2021
    Messages : 1 327
    Par défaut
    Au delà du débat c'est raciste vs c'est de l'humour noir, il est clair que ce n'est pas des garde-fous mis en place par Google, TikTok ou d'autres entreprises qui changeront quoi que se soit à long terme.

    De plus en plus, le développement de l'IA sera axé sur l'open-source, et les images et même vidéos générés par IA seront de moins en moins détectables.
    Il sera indispensable de former les gens à l'IA, de réaliser de grosses campagnes de prévention, afin d'éviter de se retrouver avec des gens faisant confiance à des image/vidéos fictives qui se font passer pour vrai.

    Concernant le racisme, sur le fond, je ne pense pas que l'IA générative aggravera les choses par rapport à aujourd'hui. Un raciste n'a pas besoin d'une IA pour se sentir conforter dans ses idées...
    C'est surtout l'IA de fichage et de surveillance qui risque de renforcer le racisme, et qui d'ailleurs à déjà commencer à le faire.

  10. #10
    Invité de passage
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juillet 2025
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2025
    Messages : 2
    Par défaut
    Pour celui qui demande une définition du racisme : https://fr.m.wikipedia.org/wiki/Racisme
    Ici chaque extrait vidéo est clairement raciste et si vous ne voyez que du contenu absurde c’est que vous n’avez pas la référence au cliché raciste utilisé (ou que ne voulez pas la voir). Ce n’est pas parce que c’est "rigolo" qu’il faut continuer à le faire. Lancer des nains c’était sûrement très marrant. Les "experts éminents" de c news sont de passage.

  11. #11
    Membre éprouvé
    Avatar de calvaire
    Homme Profil pro
    .
    Inscrit en
    Octobre 2019
    Messages
    2 038
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Singapour

    Informations professionnelles :
    Activité : .
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2019
    Messages : 2 038
    Par défaut
    Citation Envoyé par fredpeaks Voir le message
    Pour celui qui demande une définition du racisme : https://fr.m.wikipedia.org/wiki/Racisme
    Ici chaque extrait vidéo est clairement raciste et si vous ne voyez que du contenu absurde c’est que vous n’avez pas la référence au cliché raciste utilisé (ou que ne voulez pas la voir). Ce n’est pas parce que c’est "rigolo" qu’il faut continuer à le faire. Lancer des nains c’était sûrement très marrant. Les "experts éminents" de c news sont de passage.
    Alors Wikipedia c'est pas une science exacte et est clairement orienté politiquement.
    Ensuite la frontière entre d'humour ou racisme reste propre a chacun j'ai envie de dire, car ça varie beaucoup en fonction de l'époque et de chaque culture/pays. L’Europe de l'ouest devient de plus en plus coincé du cul, ce qui n'est heureusement pas le cas partout dans le monde.
    Moi je trouve ces films/sketch très drôle





    a l'inverse certains film progressiste sont d'une médiocrité abyssale comme "Toutes pour une" ou le dernier grand chef d’œuvre de l'exception culturelle française (hum hum...) Le Grand déplacement.
    Ces films sont d'ailleurs d’après te définition de wikipedia raciste, les hommes blancs hétéro sont représenté de manière très offensante et déshumanisante.
    J'en entends pourtant peu râler quand des femmes ou des noirs humilie un homme blanc dans des films, l'inverse par contre... combien de personne indigné car un homme blanc sait pris une claque par une femme et donc victime de violence conjugale ?
    Combien de personne indigné par la claque du président Macron par sa femme ? une beigne sur Brigitte j'ai le sentiment que ça aurait été très différent. Mais bon c'est juste un "sentiment" hein

    Le racisme n'est pas la ou on le pense finalement....
    La France est un pays qui redistribue tout sauf de l'espoir.

  12. #12
    Membre averti
    Homme Profil pro
    Architecte de système d'information
    Inscrit en
    Novembre 2015
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 67
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Architecte de système d'information
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Novembre 2015
    Messages : 20
    Par défaut IL FAUT SUPRIMMER TIKTOK DE LA PLANETE, ***URGENT***
    Si on constate les dérives de TIKTOK aux USA, en France c'est tout à fait dramatique l'influence de ce réseau social sur les ados de 15 à 20 ans ! c'est le cas de ma fille de 19 ans : si c'est expliqué et dit sur TikTok, cela vaut mieux que l'explication de mes parents ! Agissez pour faire supprimer TikTok du réseau en France. Le ministère du numérique, il fait quoi ? Rcemment, on a vu que la grande bretagne avait apris après un attentat au couteau, qu'il fallait agir pour filtrer les achats d'armes sur le net : désormais, toutes les offres concernant des couteaux avec lames > 13cm n'éxistent plus en OK : en france, avec la même recherche, tout apparaît ! que fait le gouvernement francais ? que font les députés ?

  13. #13
    Membre éprouvé
    Avatar de calvaire
    Homme Profil pro
    .
    Inscrit en
    Octobre 2019
    Messages
    2 038
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Singapour

    Informations professionnelles :
    Activité : .
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2019
    Messages : 2 038
    Par défaut
    Citation Envoyé par azurman Voir le message
    Si on constate les dérives de TIKTOK aux USA, en France c'est tout à fait dramatique l'influence de ce réseau social sur les ados de 15 à 20 ans ! c'est le cas de ma fille de 19 ans : si c'est expliqué et dit sur TikTok, cela vaut mieux que l'explication de mes parents ! Agissez pour faire supprimer TikTok du réseau en France. Le ministère du numérique, il fait quoi ? Rcemment, on a vu que la grande bretagne avait apris après un attentat au couteau, qu'il fallait agir pour filtrer les achats d'armes sur le net : désormais, toutes les offres concernant des couteaux avec lames > 13cm n'éxistent plus en OK : en france, avec la même recherche, tout apparaît ! que fait le gouvernement francais ? que font les députés ?
    Oui faut interdire les couteaux, ensuite les cutter, ensuite les fourchettes, ensuite les haches en magasin de bricolage, ensuite les foret de perceuse > 13cm, ensuite les clous > 13cm, ensuite les visses > 13cm, et enfin interdire l'émission Forged in Fire (le meilleur forgeron), car cette émission ultra toxique diffusé à la télé apprends aux jeunes a fabriquer de très bon couteaux hyper tranchant eux même.
    Vous savez qu'on peux acheter des arbalètes de 300 livres sans problème ? Et je préfère me prendre une balle de chasseur qu'un carreaux d’arbalète. Y'a de très bon produits sur le site de hattila

    interdire les couteaux réglera rien, on sait très bien quels sont les jeunes qui pose problèmes, et dans quels quartiers/lieux il y'a des problèmes.
    Demain on ferais comme le président du Salvador Nayib Bukele, on embarque tous ceux de louche à Barbes, gare du nord, Stalingrad, Porte de la Chapelle, ça règle définitivement les problèmes pendant 10ans facile.
    La police sait très déjà très bien qui a des couteaux ou autres joyeuseté, ou ils habitent et ou ils commettent leurs crimes. C'est juste une volonté politique de maintenir le bordel, d'ailleurs vous remarquerez que jamais ces problemes n'ont lieux dans leurs quartiers a eux (les politiciens), comme par hasard...
    Ici a Singapour la police et ferme et applique la tolérance zéro, il n'y a aucun délinquant en liberté, le moindre petit crime et sévèrement puni. Il n'y a pas de trafiquant de drogue ou de meurtrier, ils ont déjà tous été condamné a mort ou a la prison a vie. La vermine ici n'existe plus et les gens honnête peuvent vivre en paix.
    La France est un pays qui redistribue tout sauf de l'espoir.

Discussions similaires

  1. Réponses: 1
    Dernier message: 23/02/2015, 09h06
  2. Réponses: 4
    Dernier message: 14/08/2014, 20h49
  3. Réponses: 4
    Dernier message: 07/12/2013, 17h08
  4. Google sort Octane 2.0, la nouvelle version de son outil de benchmark
    Par Cedric Chevalier dans le forum Internet
    Réponses: 0
    Dernier message: 13/11/2013, 13h31
  5. Réponses: 1
    Dernier message: 19/03/2010, 10h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo