IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Dall-E : le générateur d'images IA développé par OpenAI est maintenant ouvert à tous


Sujet :

Intelligence artificielle

  1. #21
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    mars 2013
    Messages
    7 135
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : mars 2013
    Messages : 7 135
    Points : 172 026
    Points
    172 026
    Par défaut Dall-E 2 : le générateur d'images IA développé par OpenAI permet désormais d'éditer des visages humains
    Dall-E 2 : le générateur d'images IA développé par OpenAI permet désormais d'éditer des visages humains,
    la fonctionnalité était auparavant interdite par crainte d'une mauvaise utilisation

    OpenAI permet aux utilisateurs de son programme générateur d'art AI DALL-E d'éditer des images avec des visages humains. Cette fonctionnalité était auparavant interdite en raison de craintes d'utilisation abusive, mais, dans une lettre envoyée aux millions d'utilisateurs de DALL-E, OpenAI dit qu'il ouvre l'accès après avoir amélioré ses filtres pour supprimer les images qui contiennent des « contenus sexuels, politiques et violents ».

    La fonctionnalité permettra aux utilisateurs de modifier des images de différentes manières. Ils peuvent télécharger une photo de quelqu'un et générer des variations de l'image, par exemple, ou ils peuvent modifier des fonctionnalités spécifiques, comme changer les vêtements ou la coiffure de quelqu'un. La fonctionnalité sera sans aucun doute utile à de nombreux utilisateurs des industries créatives, des photographes aux cinéastes.

    « Beaucoup d'entre vous nous ont dit que cela vous manquait d'utiliser DALL-E pour imaginer des tenues et des coiffures sur vous-mêmes et éditer les arrière-plans des photos de famille. Un chirurgien reconstructeur nous a dit qu'il utilisait DALL-E pour aider ses patients à visualiser les résultats. Et les cinéastes nous ont dit qu'ils voulaient pouvoir éditer des images de scènes avec des gens pour aider à accélérer leurs processus créatifs… Nous avons construit de nouvelles techniques de détection et de réponse pour arrêter les abus(...). Grâce aux améliorations de notre système de sécurité, DALL·E est désormais prêt à prendre en charge ces cas d'utilisation délicieux et importants, tout en minimisant le potentiel de dommages causés par les deepfakes », a déclaré OpenAI dans sa lettre aux clients annonçant la nouvelle
    .

    L'intelligence artificielle a souvent affronté les humains dans des combats créatifs. Il peut battre les grands maîtres aux échecs, créer des symphonies, produire des poèmes et, désormais, créer des œuvres d'art détaillées à partir d'une courte invite écrite. L'équipe d'OpenAI a récemment créé un logiciel puissant, capable de produire une large gamme d'images en quelques secondes, juste à partir d'une chaîne de mots qui lui est donnée. Ce programme est connu sous le nom de Dall-E 2 et a été conçu pour révolutionner la façon dont nous utilisons l'IA avec les images.

    En juillet, OpenAI a annoncé qu'il inviterait plus de personnes à le tester. La société a déclaré qu'elle prévoyait de laisser entrer jusqu'à 1 million de personnes de sa liste d'attente au cours des prochaines semaines, alors qu'elle passe de sa phase de recherche à sa phase bêta. On ne sait pas si DALL-E sera un jour entièrement accessible au public, mais l'expansion devrait être un test important pour la plate-forme, de nombreux chercheurs surveillant la manière dont la technologie sera utilisée de manière abusive.

    OpenAI a gardé DALL-E étroitement surveillé par crainte que des personnes malveillantes n'utilisent ce puissant outil pour diffuser de la désinformation. Imaginez quelqu'un essayant de l'utiliser pour fabriquer des images de la guerre en Ukraine, ou créer des images réalistes de catastrophes naturelles qui ne se sont jamais produites. De plus, la génération d'une image avec la plateforme consomme tellement d'énergie que les responsables de l'entreprise craignaient que ses serveurs ne s'effondrent si trop de personnes essayaient de l'utiliser en même temps.

    Que fait le Dall-E 2 ?

    En 2021, la société de développement de la recherche sur l'IA OpenAI a créé un programme connu sous le nom de «Dall-E» - un mélange des noms Salvador Dali et Wall-E. Ce logiciel a été capable de prendre une invite écrite et de créer une image générée par l'IA complètement unique. Par exemple, « un renard dans un arbre » ferait apparaître une photo d'un renard assis dans un arbre, ou l'invite « astronaute avec un bagel à la main » montrerait… eh bien, vous voyez où cela mène.

    Bien que ce soit certainement impressionnant, les images étaient souvent floues, pas tout à fait précises et prenaient un certain temps à créer. Maintenant, OpenAI a apporté de vastes améliorations au logiciel, créant Dall-E 2 - une nouvelle itération puissante qui fonctionne à un niveau beaucoup plus élevé.

    Outre quelques autres nouvelles fonctionnalités, la principale différence avec ce deuxième modèle est une énorme amélioration de la résolution de l'image, des latences plus faibles (le temps nécessaire à la création de l'image) et un algorithme plus intelligent pour créer les images.

    Le logiciel ne se contente pas de créer une image dans un style unique, vous pouvez ajouter différentes techniques artistiques à votre demande, en entrant des styles de dessin, de peinture à l'huile, un modèle en pâte à modeler, tricoté en laine, dessiné sur un mur de grotte, ou même comme une affiche de film des années 1960.

    « Dall-E est un assistant très utile qui amplifie ce qu'une personne peut normalement faire, mais cela dépend vraiment de la créativité de la personne qui l'utilise. Un artiste ou quelqu'un de plus créatif peut créer des choses vraiment intéressantes », explique Aditya Ramesh, l'un des ingénieurs principaux de Dall-E 2.

    Nom : cos.png
Affichages : 955
Taille : 435,0 Ko
    La « première de couverture de magazine artificiellement intelligente au monde » de Cosmopolitan, réalisée grâce à DALL-E 2

    Un touche-à-tout

    En plus de la capacité de la technologie à produire des images uniquement sur des invites textuelles, Dall-E 2 dispose de deux autres techniques intelligentes : l'inpainting (le nom donné à la technique de reconstruction d'images détériorées ou de remplissage des parties manquantes d'une image) et les variations. Ces deux applications fonctionnent de manière similaire au reste de Dall-E, juste avec une touche.

    Avec l'inpainting, vous pouvez prendre une image existante et y ajouter de nouveaux éléments ou en modifier des parties. Si vous avez une image d'un salon, vous pouvez ajouter un nouveau tapis, un chien sur le canapé, changer le tableau au mur ou même faire apparaître un éléphant dans la pièce… parce que quelqu'un pourrait y penser, voyez vous.

    Variations est un autre service qui nécessite une image existante. Insérez une photo, une illustration ou tout autre type d'image et l'outil de variation de Dall-E créera des centaines de ses propres versions. Vous pouvez lui donner une image d'un des télétubbies, et il la reproduira, créant des versions similaires. Une vieille peinture d'un samouraï créera des images similaires, vous pouvez même prendre une photo de certains graffitis que vous voyez et obtenir des résultats similaires.

    Vous pouvez également utiliser cet outil pour combiner deux images en une seule. Mélangez un dragon et un corgi, ou un arc-en-ciel et un pot pour générer des pots avec de la couleur.

    DALL-E 2 s'appuie sur CLIP, un système de vision par ordinateur qu'OpenAI a également annoncé l'année dernière. « DALL-E 1 a simplement repris notre approche GPT-3 du langage et l'a appliquée à la production d'une image : nous avons comprimé les images en une série de mots et nous avons simplement appris à prédire ce qui allait suivre », explique Prafulla Dhariwal, chercheur chez OpenAI, en référence au modèle GPT utilisé par de nombreuses applications d'IA textuelle.

    Mais la correspondance des mots n'a pas nécessairement permis de saisir les qualités les plus importantes aux yeux des humains, et le processus de prédiction a limité le réalisme des images. CLIP a été conçu pour regarder les images et résumer leur contenu comme le ferait un humain. OpenAI a itéré sur ce processus pour créer "unCLIP", une version inversée qui commence par la description et se dirige vers l'image. DALL-E 2 génère l'image à l'aide d'un processus appelé "diffusion", que Dhariwal décrit comme le fait de commencer par un "sac de points", puis de remplir un motif de plus en plus détaillé.

    Le logiciel pourrait aider les gens à retoucher leurs photos, à créer des œuvres d'art ou à produire d'innombrables images de stock. « DALL-E 2 est un projet de recherche que nous ne mettons actuellement pas à disposition dans notre API », a déclaré OpenAI. « Dans le cadre de nos efforts pour développer et déployer l'IA de manière responsable, nous étudions les limites et les capacités de DALL-E avec un groupe restreint d'utilisateurs. »

    L'arrivée du mode Outpainting

    Il y a quelques semaines, OpenAI a annoncé l'arrivée de ce mode :

    Citation Envoyé par OpenAI
    Aujourd'hui, nous présentons Outpainting, une nouvelle fonctionnalité qui aide les utilisateurs à étendre leur créativité en continuant une image au-delà de ses frontières d'origine - en ajoutant des éléments visuels dans le même style ou en prenant une histoire dans de nouvelles directions - simplement en utilisant une description en langage naturel.

    La fonction d'édition de DALL·E permet déjà des modifications dans une image générée ou téléchargée - une capacité connue sous le nom d'Inpainting. Désormais, avec Outpainting, les utilisateurs peuvent étendre l'image d'origine, en créant des images à grande échelle dans n'importe quel rapport d'aspect. Outpainting prend en compte les éléments visuels existants de l'image - y compris les ombres, les reflets et les textures - pour conserver le contexte de l'image d'origine.

    Aujourd'hui, plus d'un million de personnes utilisent DALL·E, le système d'IA qui génère des images et des illustrations originales à partir d'une description en langage naturel, comme outil de création. Les artistes ont déjà créé des images remarquables avec la nouvelle fonctionnalité Outpainting et nous ont aidés à mieux comprendre ses capacités dans le processus.

    Outpainting est désormais disponible pour tous les utilisateurs DALL·E sur ordinateur.
    L'édition de visage humain débarque

    La décision fait partie d'une négociation en cours entre les fabricants de générateurs d'art IA avec leurs propres utilisateurs alors qu'ils tentent de naviguer dans les méfaits potentiels de la technologie. En tant qu'entreprise bien financée ayant des liens avec des géants de la technologie comme Microsoft, OpenAI a adopté une approche relativement prudente. Mais la société a été débordée par des concurrents comme Stable Diffusion, qui impose moins de contraintes aux utilisateurs. Cela conduit à un développement plus rapide de la technologie, mais rend également les applications malveillantes beaucoup plus faciles. Stable Diffusion, par exemple, est déjà utilisé pour générer des deepfakes pornographiques de célébrités.

    Un tel matériel explicite devrait être facile à bloquer pour OpenAI avec DALL-E. Les conditions d'utilisation de l'entreprise interdisent également aux utilisateurs de télécharger des images de personnes sans leur consentement (bien que cela soit essentiellement impossible à appliquer de manière proactive avec son modèle d'accès actuel). Cependant, aucun filtre de contenu n'est parfait et il peut y avoir des cas d'utilisation nuisibles plus subtils que la pornographie non consensuelle.

    Nom : dall.png
Affichages : 937
Taille : 276,1 Ko

    Limites de Dall-E 2

    Bien qu'il n'y ait aucun doute sur l'impressionnante de cette technologie, elle n'est pas sans limites.

    Un problème auquel vous êtes confronté est la confusion de certains mots ou expressions. Par exemple, des chercheurs ont noté que lorsqu'ils saisissaient « un trou noir à l'intérieur d'une boîte », Dall-E 2 renvoyait un trou noir à l'intérieur d'une boîte, au lieu du corps cosmique qu'ils recherchaient.

    Cela peut se produire souvent lorsqu'un mot a plusieurs sens, des phrases peuvent être mal comprises ou si des expressions familières sont utilisées. C'est ce qu'il faut attendre d'une intelligence artificielle prenant le sens littéral de vos propos.

    « Une autre chose à laquelle il faut s'habituer avec le système est le fonctionnement des invites et des styles artistiques. Lorsque vous tapez quelque chose, l'image initiale peut ne pas être correcte et bien qu'elle corresponde techniquement à votre demande, elle ne correspond pas entièrement à la sensation ou à l'idée que vous aviez en tête. Cela peut prendre un certain temps pour s'y habituer et demander quelques ajustements mineurs », explique Ramesh.

    Un autre domaine dans lequel Dall-E peut devenir confus est le « mélange variable ». « Si vous demandez au modèle de dessiner un cube rouge au-dessus d'un cube bleu, il devient parfois confus et fait le contraire. Nous pouvons résoudre ce problème assez facilement dans les futures itérations du système, je pense », a expliqué Ramesh.

    Sources : lettre aux clients de DALL-E, exemples de résultats (1, 2)

    Et vous ?

    Que pensez-vous des générateurs d'images en général et de DALL-E 2 en particulier ?
    Que pensez-vous du fait qu'OpenAI ait autorisé à nouveau l'édition des visages ?
    Voyez-vous des abus potentiels ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #22
    Chroniqueur Actualités
    Avatar de Bruno
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    mai 2019
    Messages
    1 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : mai 2019
    Messages : 1 016
    Points : 20 660
    Points
    20 660
    Par défaut Dall-E : le générateur d'images IA développé par OpenAI est maintenant ouvert à tous
    Dall-E : le générateur d'images IA développé par OpenAI est maintenant ouvert à tous,
    en supprimant la liste d'attente,OpenAI donne la possibilité à tout le monde pour s'inscrire et l'utiliser

    Le groupe de recherche en intelligence artificielle OpenAI a annoncé qu'elle a supprimé la liste d'attente pour son service de générateur d'images AI DALL-E. Cela signifie que tout le monde peut s'inscrire et l'utiliser. « À partir d'aujourd'hui, nous supprimons la liste d'attente pour la version bêta de DALL-E afin que les utilisateurs puissent s'inscrire et commencer à l'utiliser immédiatement. Plus de 1,5 million d'utilisateurs créent aujourd'hui activement plus de 2 millions d'images par jour avec DALL-E - des artistes et directeurs de la création aux auteurs et architectes - et plus de 100 000 utilisateurs partagent leurs créations et leurs commentaires dans notre communauté Discord », a écrit OpenAI dans un post publié le 28 septembre.

    DALL-E est un modèle de synthèse d'images par apprentissage profond qui a été entraîné sur des centaines de millions d'images tirées d'Internet. Il utilise une technique appelée diffusion latente pour apprendre les associations entre les mots et les images. Ainsi, les utilisateurs de DALL-E peuvent saisir une description textuelle, appelée invite, et la voir restituée visuellement sous la forme d'une image de 1024×1024 pixels dans presque tous les styles artistiques.

    Nom : dalle mini2B.png
Affichages : 1367
Taille : 425,8 Ko

    Outre la génération d'images en texte, DALL-E comprend également une fonction appelée "Outpainting" qui permet de télécharger une image et d'en étendre les bords grâce à la synthèse d'image. Il est également possible de fusionner plusieurs photos en une seule en générant un pont visuel entre elles, en mélangeant les styles.

    En avril de cette année, OpenAI a créé une nouvelle version de DALL-E, son programme de génération de texte en image. DALL-E 2 est une version à plus haute résolution et à plus faible latence du système original, qui produit des images représentant les descriptions écrites par les utilisateurs.

    Nommé d'après l'artiste surréaliste Salvador Dali et le personnage robot de Pixar, Wall-E, le prédécesseur du modèle, DALL-E, a été lancé l'année dernière. Ce logiciel est capable de créer des images dans différents styles artistiques lorsqu'il est guidé par des entrées de texte : il génère des images à partir de ce que vous lui décrivez. Vous demandez un cœur anatomiquement réaliste, ou un dessin animé d'un bébé radis chinois en tutu promenant un chien, et il fera de son mieux pour créer une image qui y correspond.

    La nouvelle version, DALL-E 2, est censée être plus polyvalente et capable de générer des images à partir de légendes à des résolutions plus élevées. Elle est également dotée de nouvelles capacités. Il s'agissait d'un test limité mais fascinant de la capacité de l'IA à représenter visuellement des concepts, qu'il s'agisse de la représentation banale d'un mannequin en chemise de flanelle, d'une « girafe en tortue » ou de l'illustration d'un radis promenant un chien.

    Dall-E 2 permet désormais d'éditer des visages humains. Cette fonctionnalité était auparavant interdite en raison de craintes d'utilisation abusive, mais, dans une lettre envoyée aux millions d'utilisateurs de DALL-E, OpenAI dit qu'il ouvre l'accès après avoir amélioré ses filtres pour supprimer les images qui contiennent des « contenus sexuels, politiques et violents ».

    La fonctionnalité permettra aux utilisateurs de modifier des images de différentes manières. Ils peuvent télécharger une photo de quelqu'un et générer des variations de l'image, par exemple, ou ils peuvent modifier des fonctionnalités spécifiques, comme changer les vêtements ou la coiffure de quelqu'un. La fonctionnalité sera sans aucun doute utile à de nombreux utilisateurs des industries créatives, des photographes aux cinéastes.

    « Beaucoup d'entre vous nous ont dit que cela vous manquait d'utiliser DALL-E pour imaginer des tenues et des coiffures sur vous-mêmes et éditer les arrière-plans des photos de famille. Un chirurgien reconstructeur nous a dit qu'il utilisait DALL-E pour aider ses patients à visualiser les résultats. Et les cinéastes nous ont dit qu'ils voulaient pouvoir éditer des images de scènes avec des gens pour aider à accélérer leurs processus créatifs… Nous avons construit de nouvelles techniques de détection et de réponse pour arrêter les abus(...). Grâce aux améliorations de notre système de sécurité, DALL·E est désormais prêt à prendre en charge ces cas d'utilisation délicieux et importants, tout en minimisant le potentiel de dommages causés par les deepfakes », a déclaré OpenAI dans sa lettre aux clients annonçant la nouvelle.

    Leurs commentaires ont inspiré des fonctionnalités telles que Outpainting, qui permet aux utilisateurs de poursuivre une image au-delà de ses limites d'origine et de créer des images plus grandes de n'importe quelle taille, et les collections, afin que les utilisateurs puissent créer de toutes nouvelles façons et accélérer leurs processus créatifs.

    Les enseignements tirés de l'utilisation en conditions réelles ont permis à OpenAI d'améliorer les systèmes de sécurité, ce qui rend possible une plus grande disponibilité aujourd'hui. Au cours des derniers mois, OpenAI a rendu les filtres plus robustes pour rejeter les tentatives de génération de contenus sexuels, violents et autres qui violent la politique de contenu, et a mis au point de nouvelles techniques de détection et de réponse pour mettre fin aux abus.

    Le mois dernier, nous avons présenté Stable Diffusion de Stability AI. Les poids modèles sont hébergés par Hugging Face une fois l'accès obtenu. Stability.ai voulaient construire une alternative à DALL-E 2, et ils aurat fini par faire beaucoup plus. Pour certains analystes, la diffusion stable incarne les meilleures caractéristiques du monde de l'art de l'IA : « il s'agit sans doute du meilleur modèle d'art de l'IA open source existant. C'est tout simplement du jamais vu et cela aura des conséquences énormes », déclare l’un d’entre eux.

    Stable Diffusion est un modèle de diffusion latente texte-image. Grâce à un généreux don de calcul de Stability AI et au soutien de LAION, les chercheurs ont pu entraîner un modèle de diffusion latente sur des images 512x512 provenant d'un sous-ensemble de la base de données LAION-5B. Similaire à Imagen de Google, ce modèle utilise un encodeur de texte CLIP ViT-L/14 gelé pour conditionner le modèle à des invites textuelles. Avec son UNet de 860M et son encodeur de texte de 123M, le modèle est relativement léger et fonctionne sur un GPU avec au moins 10 Go de VRAM.

    Contrairement à DALL-E mini et Disco Diffusion, qui sont des logiciels ouverts, Stable Diffusion peut créer d'incroyables œuvres d'art photoréalistes et artistiques qui n'ont rien à envier aux modèles d'OpenAI ou de Google. Certains affirment même qu'il s'agit du nouvel état de l'art parmi les « moteurs de recherche génératifs ».

    Stability.ai serait né pour créer non pas seulement des modèles de recherche qui n'arrivent jamais dans les mains de la majorité, mais des outils avec des applications du monde réel ouvertes pour les utilisateurs. C'est un changement par rapport à d'autres entreprises technologiques comme OpenAI, qui garde jalousement les secrets de ses meilleurs systèmes (GPT-3 et DALL-E 2), ou Google qui n'a jamais eu l'intention de publier ses propres systèmes (PaLM, LaMDA, Imagen ou Parti) en tant que bêtas privés.

    Le succès absolument viral de Craiyon, malgré sa qualité inférieure, a mis en évidence les lacunes de DALL-E en tant que bêta fermée. Les gens ne veulent pas voir comment les autres créent des œuvres d'art impressionnantes. Ils veulent le faire eux-mêmes. Stability.ai est allé encore plus loin, car cette version publique n'est pas seulement destinée à partager les poids et le code du modèle - qui, bien qu'ils soient essentiels au progrès de la science et de la technologie, n'intéressent pas la plupart des gens. La société a également facilité la création d'un site Web prêt à l'emploi, sans code, pour ceux d'entre nous qui ne veulent pas ou ne savent pas coder.

    Source : DALL-E

    Et vous ?

    Que pensez-vous des générateurs d'images en général et de DALL-E en particulier ?

    Que pensez-vous du fait le générateur d'images IA développé par OpenAI soit maintenant ouvert à tous ?

    Voyez-vous des abus potentiels ?

    Que pensez-vous de la concurrence ? Stable Diffusion de Stability AI par exemple.

    Voir aussi :

    Stable Diffusion de Stability AI serait le modèle d'IA le plus important de tous les temps, contrairement à GPT-3 et DALL-E 2, il apporte des applications du monde réel ouvertes pour les utilisateur

    Dall-E 2 : le générateur d'images IA développé par OpenAI est disponible en bêta. Il peut produire une large gamme d'images à partir de quelques mots

    Un ingénieur porte plainte contre l'office US des brevets pour avoir refusé d'accorder des brevets à son IA, sous le prétexte que seules les « personnes physiques » en ont le droit
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Réponses: 1
    Dernier message: 01/02/2021, 09h08
  2. Réponses: 6
    Dernier message: 05/10/2016, 19h08
  3. Réponses: 77
    Dernier message: 29/11/2013, 13h31
  4. Microsoft étend son projet 4Afrika à l'Afrique du Sud
    Par Stéphane le calme dans le forum Actualités
    Réponses: 1
    Dernier message: 02/08/2013, 11h02
  5. Réponses: 19
    Dernier message: 16/09/2009, 08h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo