IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Des chercheurs ont publié un article décrivant comment leur IA "GameNGen" peut créer un jeu de type Doom


Sujet :

Intelligence artificielle

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Chroniqueur Actualités
    Avatar de Anthony
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Novembre 2022
    Messages
    1 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Novembre 2022
    Messages : 1 721
    Par défaut Des chercheurs ont publié un article décrivant comment leur IA "GameNGen" peut créer un jeu de type Doom
    L'IA peut désormais générer Doom sans moteur de jeu : des chercheurs ont publié un article décrivant comment leur IA "GameNGen" peut créer un jeu de type Doom sur un réseau neuronal

    Des chercheurs de Google ont publié un article expliquant comment leur intelligence artificielle (IA) « GameNGen » peut créer un jeu semblable à Doom sur un réseau neuronal.

    Doom est un jeu de tir à la première personne développé et publié par id Software. Sorti le 10 décembre 1993 sur DOS, il s'agit du premier opus de la franchise Doom. Le joueur incarne un marine de l'espace, plus tard officieusement appelé Doomguy, qui se bat contre des hordes de morts-vivants et de démons envahissants. Le jeu commence sur les lunes de Mars et se termine en enfer, le joueur traversant chaque niveau pour trouver la sortie ou vaincre le boss final. Il s'agit d'un des premiers exemples de graphisme en 3D dans les jeux vidéo. Les ennemis et les objets sont des images en 2D, une technique parfois appelée graphisme en 2,5D.


    Les scientifiques, Dani Valevski, Yaniv Leviathan, Moab Arar et Shlomi Fruchter à l'origine de GameGen, ont associé Stable Diffusion, l'IA de génération d'images de Stability AI, à la détection d'entrée, au traitement des images générées précédemment et à la production de nouvelles images (et donc de sections de jeu/de niveaux) qui sont cohérentes d'un moment à l'autre.

    Cela signifie que vous ne jouerez pas à de véritables niveaux de Doom sur GameNGen. Le modèle utilise ce qu'il sait de Doom pour créer des niveaux semblables à ceux de Doom, un peu comme le font les mods créés par des fans pour d'autres jeux. Le modèle construit des niveaux autour du joueur en temps réel, pendant qu'il joue.

    Le Doom de GameNGen peut être joué comme un « vrai » jeu vidéo, avec des armes, des ennemis, des portes verrouillées et des points de vie, mais il n'est pas parfait. Dans un clip, on voit Doom Guy sauter dans du poison et sa santé rester à 4 % au lieu de mourir. C'est tout de même très impressionnant et, selon l'article, « les évaluateurs humains ne sont que légèrement meilleurs que le hasard pour distinguer les courtes séquences du jeu des séquences de la simulation ».

    Comment l'équipe de GameNGen a-t-elle réussi à faire jouer Doom à une IA ?

    Les IA ont besoin d'énormes quantités de données pour faire des prédictions efficaces et générer un contenu qui ait du sens. Les scientifiques ont reconnu qu'il n'était pas possible de collecter suffisamment de données de jeu auprès de joueurs humains pour entraîner leur modèle. Ils ont donc commencé par entraîner un agent IA à jouer à Doom à tous les niveaux de difficulté, en simulant un éventail de niveaux de compétence des joueurs afin d'obtenir une image aussi complète que possible de la jouabilité de Doom.

    Pour contourner les défauts de la génération d'images qui entraînent une perte de précision et de cohésion au fil du temps, les scientifiques ont formé de nouvelles images en réinjectant les images précédentes, ainsi que les entrées de l'utilisateur, au-delà des invites typiques d'une seule image. Ils ont ensuite corrompu ces images avec du bruit gaussien (un type de bruit électrique aléatoire) et ont utilisé un réseau distinct pour corriger ces images. Cela a permis de créer une boucle d'autocorrection qui a permis de jouer sur des périodes beaucoup plus longues que sans cette méthode.

    À l'heure actuelle, le générateur ne dispose que d'une mémoire d'environ trois secondes, ce qui signifie qu'il ne sait pas vraiment ce que vous avez fait il y a une minute.

    Cela signifie que les éléments qui nécessitent une connaissance permanente du jeu, comme les clés possédées, sont difficiles à gérer et constituent un obstacle critique que les scientifiques continueront de travailler à surmonter.

    Bien qu'encore imparfait, GameNGen constitue une avancée importante pour les jeux et les moteurs générés par l'IA. De plus, il contribue au vaste genre « quelqu'un a mis Doom sur [...] », qui s'est récemment étendu à « quelqu'un a mis Doom dans Fortnite », un groupe prestigieux et croissant de clones légers de Doom.

    Qu'est ce que GameGen ?

    GameNGen est le premier moteur de jeu entièrement alimenté par un modèle neuronal qui permet d'interagir en temps réel avec un environnement complexe sur de longues trajectoires avec une qualité élevée. GameNGen peut simuler de manière interactive le jeu classique Doom à plus de 20 images par seconde sur une seule TPU. La prédiction de l'image suivante atteint un PSNR de 29,4, comparable à la compression JPEG avec perte. Les évaluateurs humains sont à peine plus performants que le hasard pour distinguer les courtes séquences du jeu des séquences de la simulation.

    GameNGen est formé en deux phases : (1) un agent d'apprentissage par renforcement apprend à jouer au jeu et les sessions de formation sont enregistrées, et (2) un modèle de diffusion est formé pour produire l'image suivante, conditionnée par la séquence d'images et d'actions antérieures. Les augmentations de conditionnement permettent une génération auto-régressive stable sur de longues trajectoires.

    Architecture de GameGen

    Nom : Architecture_08_27.png
Affichages : 71523
Taille : 60,1 Ko

    Collecte de données via le jeu d'un agent : comme il n'est pas possible de collecter des données sur le jeu humain à grande échelle, les auteurs de GameGen ont, dans un premier temps, entraîné un agent RL automatique à jouer au jeu, en conservant ses épisodes d'entraînement d'actions et d'observations, qui deviennent les données d'entraînement pour le modèle génératif.

    Entraînement du modèle génératif de diffusion : les auteurs ont réutilisé un petit modèle de diffusion, Stable Diffusion v1.4, et l'ont conditionné à une séquence d'actions et d'observations antérieures (frames). Pour atténuer la dérive autorégressive pendant l'inférence, ils ont corrompu les trames de contexte en ajoutant un bruit gaussien aux trames encodées pendant l'entraînement. Cela permet au réseau de corriger les informations échantillonnées dans les images précédentes et s'est avéré essentiel pour préserver la stabilité visuelle sur de longues périodes de temps.

    Réglage fin du décodeur latent : L'auto-encodeur pré-entraîné de Stable Diffusion v1.4, qui compresse des patchs de 8x8 pixels en 4 canaux latents, produit des artefacts significatifs lors de la prédiction des images de jeu, qui affectent les petits détails et en particulier le HUD de la barre inférieure. Pour tirer parti des connaissances pré-entraînées tout en améliorant la qualité de l'image, les auteurs ont entraîné uniquement le décodeur de l'auto-encodeur latent à l'aide d'une perte MSE calculée par rapport aux pixels de l'image cible.

    Source : "Diffusion models are real-time game engines" (étude de Google)

    Et vous ?

    Quel est votre avis sur le sujet ?
    Trouvez-vous cette étude de Google Research crédible ou pertinente ?
    Avez-vous utilisé cet outil ou un outil similaire pour votre usage ou le développement d'applications, et si oui qu'en pensez-vous ?

    Voir aussi :

    La nouvelle IA de Google pour les jeux vidéo vise à dépasser le stade de l'"adversaire surhumain" et à devenir un "partenaire obéissant" qui interprète et exécute des instructions en langage naturel

    Tout le monde pourra-t-il bientôt créer des jeux vidéo en s'appuyant sur l'intelligence artificielle ? Les compétences artistiques ou en matière de codage informatique deviendront-elles inutiles ?

    Créez bientôt votre propre Holodeck : Google Deepmind dévoile Genie, un modèle d'IA créant des mondes virtuels jouables à partir d'une seule image
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Membre très actif
    Homme Profil pro
    Expertise comptable
    Inscrit en
    Décembre 2019
    Messages
    862
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Expertise comptable
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2019
    Messages : 862
    Par défaut
    Technologiquement parlant c'est impressionnant.

    Par contre ça donne un peu le sentiment du serpent qui se mange la queue. C'était rigolo de mettre doom partout mais un jour ou l'autre il faudra bien aller de l'avant et faire quelque chose de nouveau. Sinon ça donne un peu l'impression que les mecs innovent mais ne savent pas quoi faire de cette innovation à part faire tourner doom dedans entre deux générations de photos de chat mignon.

    C'est un peu comme si on construisait des moteurs quantique turbo-nucléaire pour refaire rouler des 2CV.

  3. #3
    Chroniqueur Actualités
    Avatar de Anthony
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Novembre 2022
    Messages
    1 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Novembre 2022
    Messages : 1 721
    Par défaut GameGen-O, la nouvelle IA de Tencent, permet la création de jeux vidéo en monde ouvert à partir de texte
    GameGen-O de Tencent fait monter les enchères pour les jeux vidéo générés par l'IA, en permettant la création de jeux en monde ouvert à partir de texte, cela semble être le premier pas vers un moteur de jeu IA

    Tencent vient de dévoiler GameGen-O, un modèle d'IA capable de générer des jeux vidéo en monde ouvert directement à partir d'entrées textuelles. En s'appuyant sur OGameData, un vaste ensemble de données comprenant 150 jeux de nouvelle génération et 4 000 heures de séquences de jeu, GameGen-O permet de réduire considérablement les délais et les coûts de développement pour les studios de jeux. Le modèle d'IA est entraîné avec des techniques de conversion de texte en vidéo et permet de créer des personnages innovants, des environnements dynamiques, des actions complexes et divers événements. En outre, il offre un contrôle interactif, ce qui permet de simuler le gameplay.

    Des chercheurs de Google ont récemment publié un article expliquant comment leur intelligence artificielle (IA) « GameNGen » permet de créer un jeu semblable à Doom sur un réseau neuronal. Selon les auteurs de l'article, GameNGen est le premier moteur de jeu entièrement alimenté par un modèle neuronal qui permet d'interagir en temps réel avec un environnement complexe sur de longues trajectoires avec une qualité élevée. GameNGen peut simuler de manière interactive le jeu classique Doom à plus de 20 images par seconde sur une seule TPU et la prédiction de l'image suivante atteint un PSNR de 29,4, comparable à la compression JPEG avec perte. Selon les affirmations des chercheurs, les évaluateurs humains sont à peine plus performants que le hasard pour distinguer les courtes séquences du jeu des séquences de la simulation.

    Aujourd'hui, Tencent relève les enjeux des jeux vidéo générés par l'IA en présentant GameGen-O, une nouvelle IA qui permet la génération de jeux limités en monde ouvert à partir d'un texte. Cette technologie de génération procédurale vise à réduire considérablement le temps et le coût de construction des jeux en monde ouvert et du contenu avec lequel les joueurs interagissent. Tencent a travaillé avec des étudiants de Hong Kong pour développer cet ensemble de données de contenu de jeu, qui peut générer indépendamment des environnements, des personnages et des ressources de jeu.


    L'émergence de cette technologie pourrait permettre de réduire les frais généraux des studios de jeux, qui ont réduit leurs effectifs pour tenter de faire des économies au cours des dernières années. L'équipe de recherche de GameGen-O estime que « cela souligne le potentiel des modèles génératifs à servir d'alternative aux techniques de rendu, qui peuvent combiner efficacement la génération créative avec des capacités interactives... »


    Les artistes et les développeurs passent des mois à créer les personnages, les environnements, les actions et les événements de nos jeux préférés. Tencent, le géant chinois à l'origine de ce nouveau logiciel d'IA, possède un portefeuille diversifié avec des participations dans des sociétés de jeux mondiales. Riot Games (Valorant), Ubisoft Entertainment, Larian Studios (Baldur's Gate 3) et Remedy Entertainment.


    Les chercheurs en IA ont baptisé le processus de création de ces environnements « jeu en monde ouvert » (OGameData). Cette banque d'informations sur les jeux comprendrait 150 jeux de nouvelle génération et 4 000 heures de clips vidéo.

    Selon les développeurs de GameGen-O, le logiciel de jeu suit un processus en deux étapes pour développer le contenu, à savoir « la formation préalable du modèle de fondation et la mise au point des instructions. Dans la première phase, le modèle est pré-entraîné sur OGameData via la continuation texte-vidéo et vidéo, ce qui confère à GameGen-O la capacité de générer des jeux vidéo dans un domaine ouvert. Dans la deuxième phase, le modèle pré-entraîné est gelé et nous l'affinons à l'aide d'un InstructNet entraînable, qui permet la production d'images ultérieures sur la base d'instructions structurelles multimodales ».

    Le processus en est encore à ses débuts, mais des personnages comme Geralt of Rivia de The Witcher, John Marston de Red Dead Redemption et Jin Sakai de Ghost of Tsushima ont tous été rendus dans OGameData, selon la page d'annonce sur GitHub.


    Ci-dessous, les auteurs de GameGen-O présentent brièvement leur modèle d'IA de génération de jeux :

    Nous présentons GameGen-O, le premier modèle de transformateur de diffusion conçu pour la génération de jeux en monde ouvert. Ce modèle facilite la génération d'un domaine ouvert de haute qualité en simulant un large éventail de caractéristiques du moteur de jeu, telles que des personnages innovants, des environnements dynamiques, des actions complexes et divers événements. En outre, il offre un contrôle interactif, ce qui permet de simuler le gameplay.

    Le développement de GameGen-O implique un effort complet de collecte et de traitement de données à partir de zéro. Nous collectons et construisons le premier ensemble de données sur les jeux vidéo en monde ouvert (OGameData), en amassant des données complètes provenant de plus d'une centaine de jeux en monde ouvert de nouvelle génération, en utilisant un pipeline de données propriétaire pour un tri, une notation, un filtrage et un sous-titrage découplé efficaces. Ces données OGameData robustes et exhaustives constituent la base du processus d'apprentissage de notre modèle.

    GameGen-O est soumis à un processus de formation en deux étapes, consistant en un pré-entraînement du modèle de base et en un réglage des instructions. Dans la première phase, le modèle est pré-entraîné sur les OGameData via la continuation texte-vidéo et vidéo, ce qui donne à GameGen-O la capacité de générer des jeux vidéo en domaine ouvert. Dans la deuxième phase, le modèle pré-entraîné est gelé et nous l'affinons à l'aide d'un InstructNet entraînable, qui permet de produire les images suivantes sur la base d'instructions structurelles multimodales. L'ensemble de ce processus de formation confère au modèle la capacité de générer et de contrôler le contenu de manière interactive.

    En résumé, GameGen-O représente un premier pas notable dans le domaine de la génération de jeux en monde ouvert par le biais de modèles génératifs. Il souligne le potentiel des modèles génératifs à servir d'alternative aux techniques de rendu, qui peuvent combiner efficacement la génération créative avec des capacités interactives.
    Source : GameGen-O (GitHub)

    Et vous ?

    Quel est votre avis sur le sujet ?
    Trouvez-vous cette initiative de Tencent crédible ou pertinente ?
    Comment envisagez-vous l'avenir des jeux vidéo avec l'adoption de l'IA ?

    Voir aussi :

    L'IA peut désormais générer Doom sans moteur de jeu : des chercheurs ont publié un article décrivant comment leur IA "GameNGen" peut créer un jeu de type Doom sur un réseau neuronal

    Tout le monde pourra-t-il bientôt créer des jeux vidéo en s'appuyant sur l'intelligence artificielle ? Les compétences artistiques ou en matière de codage informatique deviendront-elles inutiles ?
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Réponses: 0
    Dernier message: 27/05/2023, 04h02
  2. Réponses: 4
    Dernier message: 05/04/2019, 12h49
  3. Des chercheurs ont découvert le premier ransomware écrit en Go
    Par Stéphane le calme dans le forum Sécurité
    Réponses: 4
    Dernier message: 14/10/2016, 14h13
  4. Réponses: 8
    Dernier message: 25/01/2011, 09h23

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo