IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

AlphaZero : l’IA de DeepMind qui devient imbattable sur trois jeux différents en moins de 24 heures


Sujet :

Intelligence artificielle

  1. #1
    Expert éminent sénior

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Mars 2017
    Messages
    1 177
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Madagascar

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mars 2017
    Messages : 1 177
    Points : 78 774
    Points
    78 774
    Par défaut AlphaZero : l’IA de DeepMind qui devient imbattable sur trois jeux différents en moins de 24 heures
    AlphaZero : l’IA de DeepMind qui devient imbattable sur trois jeux différents en moins de 24 heures
    Les premiers pas vers une IA généraliste ?

    Le but ultime de l’entreprise technologique britannique DeepMind, une filiale de Google spécialisée dans l’intelligence artificielle, n’a jamais été de battre des experts humains dans des jeux de stratégie réputés complexes comme les échecs ou le jeu de go.

    En réalité, l’entreprise aurait toujours eu à cœur de créer une intelligence artificielle hautement polyvalente qui serait capable de réaliser des tâches complexes avec un minimum de connaissances de base. Cette IA généraliste évoluerait de manière autonome et s’adapterait à toutes les nouvelles situations sans s’appuyer de façon permanente sur un apprentissage supervisé par des humains.

    Il faut rappeler qu’à l’heure actuelle, aucun humain n’est en mesure de rivaliser avec AlphaGo, le programme d’intelligence artificielle développé spécialement par DeepMind pour le jeu de go. L’IA ayant réussi à battre tous les experts connus de ce jeu de stratégie d’origine asiatique, la filiale de Google a estimé qu’il était temps que son programme prenne sa retraite sportive et se retire de la compétition.

    Toutefois, cela ne voulait absolument pas dire qu’AlphaGo serait abandonné, loin de là. Un nouveau rapport publié cette semaine sur le site spécialisé arXiv par les chercheurs de DeepMind suggère que l’entreprise technologique s’est déjà lancée dans un projet encore plus ambitieux.

    En effet, la filiale de Google fait de nouveau parler d’elle grâce à un nouveau programme d’IA baptisé AlphaZero qui devrait lui permettre de se rapprocher un peu plus de son objectif final à savoir : créer une intelligence artificielle hautement polyvalente et autonome qui serait capable d’apprendre et de résoudre des problèmes complexes toute seule.

    Nom : il.jpg
Affichages : 7651
Taille : 23,2 Ko

    AlphaZero serait le successeur d’AlphaGo Zero, la première IA autodidacte de la filiale de Google qui a été présentée en octobre dernier. AlphaGo Zero, pour sa part, représenterait l’évolution ultime du programme d’IA baptisé AlphaGo qui a défié et vaincu tous les grands maitres de jeu de go. À titre de comparaison, il n’aura fallu que trois petits jours à AlphaGo Zero pour venir à bout de son prédécesseur, AlphaGo, après une intense phase d’entraînement. Il faut aussi souligner qu’à l’inverse d’AlphaGo qui exploitait en même temps la technique d’apprentissage supervisé et la technique d’apprentissage par renforcement, AlphaGo Zero n’utilise que l’apprentissage par renforcement.

    En outre, depuis la création d’AlphaGo Zero, les IA développées par DeepMind utiliseraient désormais un réseau neuronal d’apprentissage profond unifié qui fusionne l’ancien « réseau de décision » avec l’ancien « réseau de valeur » qu’on retrouvait sur ses précédentes versions d’IA afin d’obtenir des IA plus performantes.

    Tout comme AlphaGo Zero, le programme d’IA baptisé AlphaZero a la particularité d’évoluer et de se perfectionner en pratiquant un « apprentissage tabula rasa par renforcement ». Avec cette méthode, on s’assure juste que le programme d’IA connait les règles de base du jeu (la manière dont les pions se déplacent sur l’aire de jeu par exemple), mais on évite de lui fournir des données préétablies concernant les stratégies ou les tactiques applicables. Dès lors, le programme d’IA est obligé de s’améliorer tout seul en jouant à de nombreuses reprises à un rythme accéléré. En d’autres termes, AlphaZero n’a pas été conçu pour être spécialement doué dans une tâche précise, mais plutôt pour se comporter comme la première ébauche d’une « version d’IA plus généraliste » que ses prédécesseurs.

    Pour illustrer le potentiel de sa nouvelle IA, DeepMind a précisé qu’il n’aura fallu que quatre heures d’entraînement et 44 millions de parties à AlphaZero en partant des règles de base du jeu d’échecs pour venir à bout de Stockfish, l’un des meilleurs programmes d’échecs actuellement. De la même manière, deux heures et 24 millions de parties auront suffi à AlphaZero pour terrasser Elmo, le meilleur programme de shogi (une variante du jeu des échecs pratiquée au Japon) ; et il ne lui aura fallu que huit heures d’entraînement et 21 millions de parties jouées contre lui-même, pour vaincre AlphaGo-Lee, la première IA à avoir dominé un joueur humain.

    Nom : 0.jpg
Affichages : 7084
Taille : 28,4 Ko

    Ce qui est remarquable ici, c’est qu’en moins de 24 heures, le même programme informatique a appris à jouer à trois jeux de plateau complexes différents et réussi à développer des capacités surhumaines à chaque fois.

    Il ne reste maintenant plus à DeepMind qu’à relever son prochain défi : battre les humains au jeu vidéo StarCraft avec une IA. Une tâche qui s’annonce des plus ardues puisqu’il n’y a pas si longtemps, un joueur professionnel qui se classe parmi les meilleurs joueurs de StarCraft dans le monde, Song Byung-gu en l’occurrence, a battu quatre robots dotés d’IA en moins de 27 minutes (le match le plus long a duré environ dix minutes et demie, alors que le plus court quant à lui n’a duré que quatre minutes et demie.).

    Source : Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (PDF)

    Et vous ?

    Qu’en pensez-vous ?

    Voir aussi

      Intelligence artificielle : AlphaGo au coude à coude avec un enfant de six ans en termes de QI, Bing et Siri font moins bien
    Jeu de Go : AlphaGo prend sa retraite et pourrait ne plus participer à des compétitions, suite à sa récente victoire sur le numéro un mondial
    AlphaGo arrive en tête du classement des meilleurs joueurs de Go au monde, la première fois pour un programme informatique
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Membre confirmé Avatar de Fusoy
    Homme Profil pro
    Pas astronaute
    Inscrit en
    Juin 2014
    Messages
    215
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Pas astronaute

    Informations forums :
    Inscription : Juin 2014
    Messages : 215
    Points : 634
    Points
    634
    Par défaut
    En moins de 24 heures c'est impressionnant pour un humain. Mais quand on prend en compte qu'il a fallu 21 à 44 millions de partie, ça devient vraiment moyen comme réussite. Il lui faudra combien de partie afin de connaitre assez bien le jeupour battre le champion de Starcraft 2 et ainsi devenir imbattable ? Beaucoup, beaucoup plus qu'un humain.
    Jouez gratuitement à Eburnean que j'ai fait avec mes petites mimines : Suivez le développement!

  3. #3
    Expert éminent sénior
    Avatar de rawsrc
    Homme Profil pro
    Dev indep
    Inscrit en
    Mars 2004
    Messages
    6 142
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Dev indep

    Informations forums :
    Inscription : Mars 2004
    Messages : 6 142
    Points : 16 545
    Points
    16 545
    Billets dans le blog
    12
    Par défaut
    Vu le nombre de parties accumulées pour en arriver là, c'est plus de la capitalisation d'expériences que de l'IA.

  4. #4
    Membre éclairé
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    467
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 467
    Points : 681
    Points
    681
    Par défaut
    L'humain n'a certainement pas dû effectuer 20 millions de parties réelles pour devenir bon. Cependant il ne faudrait pas négliger les nombreux morceaux de parties qu'il se "simule" dans la tête pour apprendre.

  5. #5
    Invité
    Invité(e)
    Par défaut
    Citation Envoyé par rawsrc Voir le message
    Vu le nombre de parties accumulées pour en arriver là, c'est plus de la capitalisation d'expériences que de l'IA.
    Absolument pas.
    44 millions de parties (environ 10^8) c'est rien comparé à la complexité du jeu d'échecs (plus de 10^100 : https://fr.wikipedia.org/wiki/Nombre_de_Shannon)

  6. #6
    Membre éclairé
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Juin 2008
    Messages
    522
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Puy de Dôme (Auvergne)

    Informations professionnelles :
    Activité : Chercheur en informatique

    Informations forums :
    Inscription : Juin 2008
    Messages : 522
    Points : 725
    Points
    725
    Par défaut
    Citation Envoyé par ijk-ref Voir le message
    L'humain n'a certainement pas dû effectuer 20 millions de parties réelles pour devenir bon. Cependant il ne faudrait pas négliger les nombreux morceaux de parties qu'il se "simule" dans la tête pour apprendre.
    Sans parler qu'un humain a appris tout au cours de sa vie et peut réutiliser son expérience pour ses jeux. Il serait intéressant de savoir si l'apprentissage est plus rapide si l'IA maitrise plus de jeux.

    Conceptuellement, Starcraft est différent du jeu d'échec, car si le jeu d'échec se joue "sans mémoire" (i.e. peu importe si on a oublié le début de la partie) et sans secret, dans Starcraft on ne voit pas tout le plateau , il y a donc besoin de mémoire pour réutiliser les informations obtenues sur ses ennemis.
    Si AlphaZero arrive a de bon résultats sur ce jeu, alors il y aura un beau progrès.
    Raphchar.

  7. #7
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    Je trouve un peu bizare que le prochain objectif soit starcraft vu que dans ce jeu, les fameuses APM (actions par minutes) sont très importante, et qu'un ordinateur bat très largement un humain sur ce point là. D'ailleurs il me semble déjà avoir vu une vidéo d'un bot qui contrôlait chacune de ses unités individuellement et roulait littéralement sur n'importe quel joueur humain.

    C'est un peu comme dans un FPS, un bot qui vise et tire en quelques ms ça n'a rien de difficile à coder et ça sera difficilement battable par un humain.

    Après s'ils limitent les APM du bot artificiellement pour qu'il se concentre sur la stratégie, why not.

  8. #8
    Membre du Club
    Inscrit en
    Juin 2005
    Messages
    58
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 58
    Points : 66
    Points
    66
    Par défaut
    C'est "facile" quand en 24H quand on peut faire 44 millions de parties, pour faire 44 millions de parties de starcraft va falloir y passer plus de temps.
    A moins d'être en mesure d’accélérer le jeu et de faire jouer l'IA face à elle même.

  9. #9
    Membre éclairé
    Homme Profil pro
    Étudiant
    Inscrit en
    Juillet 2013
    Messages
    192
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juillet 2013
    Messages : 192
    Points : 678
    Points
    678
    Par défaut
    Il y a déjà un championnat de bots/AI pour starcraft (https://sscaitournament.com/). Ils ne jouent pas contre des vrais joueurs par contre donc difficile d'évaluer leur niveau.

  10. #10
    Membre éclairé
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    467
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 467
    Points : 681
    Points
    681
    Par défaut
    @Theta Les bots dont tu parles sont internes au jeu. Là on parle plutôt d'IA n'ayant que l'image, et le son comme informations - enfin je crois que c'est justement ça le but : qu'il "comprenne" ce qu'il voit.

  11. #11
    Membre actif
    Profil pro
    Inscrit en
    Août 2007
    Messages
    136
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 136
    Points : 247
    Points
    247
    Par défaut
    Bientôt ces systèmes pourront développer des programmes complexes en quelques heures, plutôt que nous en quelques mois.
    Profitons bien de ces dernières années ou nous ne sommes pas encore remplacés par ceux-ci
    "Un peuple prêt à sacrifier un peu de liberté pour un peu de sécurité ne mérite ni l'une ni l'autre, et finit par perdre les deux."
    Benjamin Franklin

Discussions similaires

  1. Nokia reprend la main sur Symbian qui devient l'OS mobile Européen
    Par Gordon Fowler dans le forum Actualités
    Réponses: 27
    Dernier message: 14/12/2010, 10h54
  2. [Studio .NET] Executable qui marche sur des PC différents
    Par black is beautiful dans le forum Autres Logiciels
    Réponses: 3
    Dernier message: 05/10/2005, 18h00
  3. [VB.NET] une chaine de caractère qui devient une propriete
    Par lucie.houel dans le forum ASP.NET
    Réponses: 8
    Dernier message: 20/09/2005, 15h10
  4. replace() qui s'applique sur toutes les occurences
    Par Oluha dans le forum Général JavaScript
    Réponses: 2
    Dernier message: 02/03/2005, 12h27
  5. Réponses: 5
    Dernier message: 16/12/2004, 23h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo