Des programmes IA seraient meilleurs au jeu de Doom que les humains
Des programmes IA seraient meilleurs au jeu de Doom que les humains
après avoir appris à jouer en regardant d'autres joueurs
A mesure que le temps passe, l’intelligence artificielle (IA) commence à montrer sa puissance dans divers domaines de la société. Il y quelques mois de cela, AlphaGo, le programme d’intelligence artificielle de Google basé sur Deepmind, était opposé à Lee Sedol, l’un des meilleurs joueurs au monde du jeu de Go. Après plusieurs matchs, AlphaGo s’est imposé 4 manches à 1. Ce succès n’a pas manqué de faire couler de l’encre autour de ce domaine en pleine exploration.
En attendant que tous les aspects de ce domaine soient véritablement mis au service de l’humanité, des développeurs viennent de creuser encore ce champ d’application et ont exploité la puissance de l’apprentissage automatique et du réseau neuronal pour faire apprendre à leurs programmes d’intelligence artificielle à jouer au jeu vidéo.
Tout est parti du concours organisé lors de la conférence IEEE sur l’intelligence informatique et les jeux du 20 au 23 septembre dernier. Ce concours mettait en compétition non pas des personnes, mais des programmes d’intelligence artificielle qui devaient jouer au jeu Doom, le jeu vidéo à la première personne (FPS) reconnu comme étant le pionnier des jeux vidéo utilisant un graphisme en 3D immersive. Dans ce jeu, le joueur doit parcourir différentes pièces et éliminer des assaillants tout en évitant de se faire tirer dessus.
Généralement, pendant les jeux, les bots peuvent avoir accès à un ensemble d’informations telles que les cartes, la position des objets, les endroits, la position des joueurs en scrutant les données sur le réseau ou dans le jeu en lui-même afin de se faciliter la tâche. Mais pour cette compétition IA, les agents IA n’ont eu droit à aucune de ces informations. Pour apprendre à jouer et s’illustrer comme le meilleur joueur lors des combats, les agents IA devaient faire comme les humains, c’est-à-dire regarder les autres joueurs (IA ou humains) jouer et bâtir leur habileté en s’appuyant seulement sur ce qu’ils ont appris en regardant les autres joueurs jouer.
Pour y arriver, les développeurs devaient soumettre un script écrit en C++, Python ou Java qui se connecterait à ViZDOOM, la plateforme de recherche IA basée sur Doom. C’est cette dernière qui a permis aux agents IA d’apprendre en regardant ce qui se passe sur l’écran. Et pour éviter toute discrimination, les développeurs ont eu droit chacun à une machine avec Windows ou Linux et fonctionnant avec un processeur Intel Core i7-4790 CPU cadencé à 3,60 GHz, 16 Go de mémoire RAM et une carte graphique GTX 960 4 GB.
Après les différents affrontements, les développeurs de Facebook ont été sacrés vainqueurs du premier concours qui imposait de jouer dans un environnement déjà maîtrisé par l’agent IA avec comme arme un lance-roquettes. En plus du lance-roquettes, l’agent IA pouvait également collecter des kits de santé et des munitions. Pour le second concours, le plus difficile qui imposait de jouer dans 2 environnements connus d’avance et dans 3 environnements inconnus aux agents IA, c’est l’équipe d’Intel qui l’a emporté.
Par ailleurs, même si ces entreprises bénéficient de talents avérés dans le domaine de l’IA, il y a une équipe de deux étudiants qui s’est particulièrement bien illustrée en obtenant les secondes places aux deux concours cités alors que Intel et Facebook n’ont participé qu’à un seul concours.
Les étudiants en question sont Guillaume Lample et Devendra Singh Chaplot de Carnegie Mellon University. Ils ont passé quatre mois à plancher sur le code de leur programme d’intelligence artificielle. Et après avoir analysé les résultats effectués par les étudiants avec leur agent IA, Lample et Chaplot soutiennent que son « architecture surpasse considérablement les agents IA intégrés au jeu ainsi que les humains dans les scénarios de combat à mort ». Tout comme AlphaGo, le programme IA des deux étudiants est basé sur le programme d’intelligence artificielle DeepMind.
Pour beaucoup, cette démonstration du potentiel de l’intelligence artificielle pourrait être exploitée dans divers domaines tels que la conduite autonome ou d’autres domaines encore afin d’amener les systèmes intelligents à pouvoir réagir comme souhaité dans des environnements inconnus tout en se basant sur les différents objets qui se présentent.
Source : Post-Gazette, ViZDOOM, Carnegie Mellon University
Et vous ?
:fleche: Que vous inspirent les avancées dans le domaine de l'intelligence artificielle ?
Voir aussi
:fleche: Jeu de Go : les développeurs s'imposent face à Lee Sedol, l'IA de Google terrasse la star du Go par un score de 4-1
:fleche: La Rubrique Algorithmique, Forum Intelligence artificielle, Cours et tutoriels Algorithmique, FAQ du langage
Le procès des algorithmes.
Bonjour. Sans vouloir diminuer l'intéret du sujet de l'article. Il y a un malentendu entre faire jouer une IA à DOOM ou au Chess/GO et rendre un robot vraiment intelligent, au moins dans ses fonctions motrices.
Ce malentendu provient du but d'un jeu qui consiste à donner l'impression d'un affrontement avec peu de choix possibles. D'où l'impression qu'on peut se contenter d'une heuristique et d'une approche statistique comme l'algorithme minimax, ou l'évolution génétique..
Jouer à doom, c'est une petite dizaine de commandes possibles dont chacune va réagir exactement de la même manière car on s'adresse à une simulation limitée. La qualité des graphiques et les astuces du simulateur donnent une impression d'immersion qui est l'objectif recherché mais introduit une confusion majeure entre jouer sur une simulation et piloter un vrai robot (ou une voiture)
Si vous montez une Raspberry pi sur un chariot motorisé avec servomoteurs pour la direction, le résultat sera presque le même à chaque tour si vous jouez dans un gymnase par exemple.
Mais ça n'aura rien à voir dés que vous vous retrouverez sur une surface avec de petits cailloux ou simplement plus ou moins humide selon la meteo.
Alors les algorithmes prédictifs qui fonctionnent très bien sur une simulation, donneront des résultats catastrophiques parce que les cailloux sont aléatoires (et se déplacent suite au passage du bot) alors que la simulation de doom donne toujours un résultat identique avec la précision d'un double !
Ce sont donc des disciplines très différentes. Les émulations de simulateurs associées à une heuristique dans une logique minimax ou génétique permettent de prévoir très loin dans l'avenir. Dans le monde réel, prévoir l'avenir peut rendre un robot dangereux (tondeuse à gazon qui présume que votre chat s'est pas en train de dormir sur la pelouse 8O)
Quant aux réseaux de neurones ou deep learning (Tensorflow) , on les utilise surtout pour reconnaître des objets sur une image.
Au final mmax, genes et tensorflow ont en commun de faciliter l'apprentissage. Au détriment du contrôle que le développeur aura sur le comportement de sa machine.
C'est un sujet très grave selon moi.
La seule raison pour laquelle les autorités s'y intéressent aussi peu est qu'elles n'y comprennent pas grand chose. Mais les automobiles sans pilote vont bientôt déferler sur les routes et il y aura forcément des accidents. On fera donc le procès des algorithmes ! Plus sérieusement , la responsabilité des intégrateurs sera sur la table et je ne voudrais pas être à leur place quand ils devront expliquer pourquoi la voiture n'a pas vu que le véhicule qui n'avait pas la priorité était un gamin de 5 ans sur un vélo à stabilisateurs...