Alphastar améliore ses performances pour atteindre le niveau de Grandmaster dans StarCraft II

Version imprimable

Voir 40 message(s) de cette discussion en une page

25/01/2019, 22h21
Bill Fassinou

1 pièce(s) jointe(s)

Alphastar améliore ses performances pour atteindre le niveau de Grandmaster dans StarCraft II

AlphaStar, la nouvelle IA de DeepMind, a écrasé des joueurs pro de Starcraft II
un jeu vidéo conçu pour défier l'intellect humain

L’IA, c’est le sujet qu’on ne présente plus. Son intrusion dans nos vies quotidiennes et cela dans tous les domaines ou presque choque certains. Des futuristes y voient une menace pour la démocratie telle que nous l’a connaissons, certains craignent que tous les emplois de demain ne soient destinés qu’aux machines intelligentes, et d’autres nous mettent en garde contre une époque où l’intelligence artificielle pourra s’améliorer d’elle-même, dépassant ainsi l’homme. Cependant, malgré toutes ces critiques dont elle est victime, les entreprises qui développent cette technologie acclament chaque succès et progrès qu’elles accomplissent.

L’intelligence artificielle semble de jour en jour prête à relever tous les défis que l’homme aura à lui lancer. C’est le cas peut-être de AlphaStar, une IA conçue par DeepMind, une filiale de Google pour tenter de rivaliser avec des professionnels de jeux tels que StarCraft II. DeepMind est une entreprise britannique spécialisée dans l'intelligence artificielle fondée en 2010. Elle est rachetée le 26 janvier 2014 par Google pour plus de 628 millions de dollars américains. L’objectif de DeepMind est de résoudre l'intelligence. Pour atteindre ce but, l'entreprise essaie de combiner les meilleures techniques de l'apprentissage automatique et des neurosciences des systèmes pour construire de puissants algorithmes d'apprentissage généraliste.

L'entreprise souhaite non seulement doter les machines d'une intelligence artificielle performante, mais aussi comprendre le fonctionnement du cerveau humain. Pour les entreprises qui développent des outils dotés d’intelligence artificielle, il faut trouver la meilleure manière de rendre sa solution plus performante. Pour cela, la complexité retrouvée dans les jeux de stratégie en temps réel (RTS) constitue un atout important comme l’explique DeepMind sur son site Web.

Pièce jointe 444621

« Les jeux sont utilisés depuis des décennies comme un moyen important de tester et évaluer les performances des systèmes d’intelligence artificielle. Au fur et à mesure que les capacités de l’IA augmentent, la communauté des chercheurs a recherché des jeux de plus en plus complexes qui capturent différents éléments d’intelligence nécessaires à la résolution de problèmes scientifiques et réels. Ces dernières années, StarCraft est considéré comme l'un des jeux de stratégie en temps réel les plus difficiles et l'un des jeux les plus joués de tous les temps. Il s'est imposé par consensus comme un “grand défi” pour la recherche sur l'IA ».

AlphaStar répond aux mêmes critères de construction que les précédentes solutions de DeepMind. Il base son apprentissage essentiellement sur un réseau de neurones qui reçoit des données d'entrée de l'interface de jeu brute (une liste d'unités et de leurs propriétés) et génère une séquence d'instructions constituant une action dans le jeu. Des informations plus utiles et plus détaillées sur sa conception et son mécanisme de fonctionnement sont présentées par DeepMind sur son site Web. Cependant, AlphaStar a, peut-on dire, réussi la mission qui est la sienne à savoir battre des joueurs professionnels du très célèbre StarCraft II.

Il est donc devenu la première intelligence artificielle à réaliser cet exploit. Connaissez-vous ce jeu de stratégie publié pour la première fois sur PC en 2010 ? Sinon, pour un petit rappel, StarCraft II est créé par Blizzard Entertainment. Il s'inscrit dans un univers fictif de science-fiction et propose un gameplay riche et multi-couches conçu pour défier l'intellect humain. A ce jeu, l’IA de DeepMind a battu à plusieurs reprises, dans une série de matchs, des joueurs professionnels tels que Grzegorz Komincs et Dario Wünsch classés respectivement 13e et 42e sur la liste des joueurs professionnels dans le monde sur un référentiel centralisé des wikis de Liquipedia.

https://youtu.be/cUTMhmVh1qs

DeepMind a tenu à expliquer que le choix s’est porté sur ce jeu compte tenu de sa complexité et que son IA a obtenu ce résultat notamment grâce son réseau de neurones qui lui confère les capacités d’un apprentissage supervisé et d’un apprentissage par renforcement. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant.

En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative. L'agent cherche au travers d'expériences itérées, un comportement décisionnel (appelé stratégie ou politique, et qui est une fonction associant à l'état courant l'action à exécuter) optimal, en ce sens qu'il maximise la somme des récompenses au cours du temps. Pour finir son argumentaire, DeepMind a indiqué que l’objectif premier d’un tel travail n’est pas simplement de réussir à battre des humains dans un jeu de stratégie, mais de mesurer à quel point les techniques de conception et les algorithmes de l’intelligence artificielle ont évolué. Grâce à cela, l’entreprise estime qu’à l’avenir, il sera possible de concevoir des agents d’IA capables d’exécuter des tâches intelligentes comme un être humain ainsi que d’autres tâches selon l’environnement dans lequel elle se trouvera.

Rappelons qu'en 2016, après AlphaGo, l’IA de Google DeepMind qui avait terrassé Lee Sedol, l’un des meilleurs joueurs de Go au monde, la filiale de Google, voulait déjà tester ses recherches en intelligence artificielle dans des domaines plus complexes, et c’est celui des jeux vidéo qui a été choisi. Le 4 novembre, lors de l’événement BlizzCon 2016 du studio Blizzard Entertainment, DeepMind avait annoncé une collaboration avec la société de développement de jeux vidéo basée en Californie pour ouvrir le jeu StarCraft II aux chercheurs en IA et en apprentissage automatique partout dans le monde.

En d’autres termes, StarCraft II était devenu le nouveau domaine dans lequel DeepMind avait décidé de tester ses recherches en intelligence artificielle. Les compétences acquises dans cet environnement plus complexe pourront ensuite être transférées dans le monde réel. En effet, « StarCraft est un environnement de test intéressant pour la recherche actuelle en IA, car il fournit un pont utile pour la complexité du monde réel », explique Google DeepMind. Et d’ajouter que : « les compétences nécessaires à un agent pour progresser dans l'environnement et bien jouer à StarCraft pourraient finalement être transférées à des tâches réelles ».

Sources : DeepMind, Liquipedia

Et vous ?

:fleche: Qu'en pensez-vous ?

Voir aussi

:fleche: L'intelligence artificielle menace-t-elle la démocratie dans le monde ? Oui, selon un conseiller principal à la Commission européenne

:fleche: Après le jeu de Go, Google DeepMind veut tester une intelligence artificielle dans StarCraft II, un jeu vidéo de stratégie en temps réel

:fleche: Google absorbe l'unité de santé de DeepMind pour transformer son application mobile Streams en assistant boosté à l'IA pour infirmières et médecins

:fleche: 70 % des projets d'IA dans le commerce numérique sont couronnés de succès d'après un sondage réalisé par Gartner

:fleche: Des chercheurs du MIT créent la première intelligence artificielle psychopathe pour illustrer le problème de biais des données nourries aux IA
26/01/2019, 13h16
codec_abc

J'ai regardé les parties et il faut encore relativiser sur les capacités de la machine. Pour faire simple, sur Starcraft II un joueur compétent doit maitriser 2 aspects:

Le "macro game": C'est la capacité à gérer ses workers, développer ses bases, scouter l'ennemie, analyser la situation et prendre des décisions en fonctions.
La "micro game": C'est la capacité à gérer les unités par petits groupes (voire de manière individuelle) lors des combats pour maximiser leur efficacité. Par exemple, lors d'un combat si un missile arrive dans vos unités et que vous n'avez pas le temps de l’éviter: Vous avez tout intérêt a faire reculer toutes les unités immédiatement. Puis vous prenez une unité, idéalement peu couteuse, pour l'envoyer dans le missile pour la sacrifier et ne pas prendre de dégâts sur les autres.

Pour avoir regardé certaines games, l'IA de DeepMind a une macro game correcte (bien qu'en dessous de ce que font les joueurs humains) et une micro game largement meilleur que tout humain. Et cela se prouve par le nombre d'actions par minutes (APM). C'est une moyenne flottante qui décrit le nombre d'actions qu'un joueur fait sur un intervalle de temps donné. L'humain étant physiquement limité, les meilleurs pro montent (souvent lors des combats) autour de 600-800 APMs dans les situations les plus tendues. DeepMind grâce à ses capacités de machine est arrivé jusqu'à 1500 APMs. De plus, il faut voir que sur l'intégralité des actions exécutés par un humain il en aura certaines qui ne seront pas efficaces (clics ratés, mauvaise touche, etc...) la ou l'IA de DeepMind fera exactement ce qu'elle veut.

Bref, l'IA de DeepMind a montré un comportement intéressant mais a gagné grâce à ses habilitées sur-humaines (temps de réaction, précision, exécution parfaite et immédiate, etc...) et non pas grâce à son intelligence.
26/01/2019, 13h23
melka one

un jour on verra un article avec un titre du genre l'IA l'arnaque publicitaire du moment.
26/01/2019, 13h31
Uther

Citation:

Envoyé par codec_abc

L'humain étant physiquement limité, les meilleurs pro montent (souvent lors des combats) autour de 600-800 APMs dans les situations les plus tendues. DeepMind grâce à ses capacités de machine est arrivé jusqu'à 1500 APMs. De plus, il faut voir que sur l'intégralité des actions exécutés par un humain il en aura certaines qui ne seront pas efficaces (clics ratés, mauvaise touche, etc...) la ou l'IA de DeepMind fera exactement ce qu'elle veut.

Tu es sur de ce que tu avances ?
Autant je suis d'accord qu’au niveau efficacité l'IA n'étant pas l'imité par l'IHM, elle a probablement 100% de ses actions efficace. Par contre j'avais lu que le nombre d'APM était bien en dessous d'un joueur humain pro.
26/01/2019, 15h11
Jex974

Oui, ils ont annoncé qu'ils ont volontairement bridé les APM justement pour ne pas que ce soit un biais. Après c'est clair qu'il y a un max de marketing et d'effets d'annonce derrière. Toujours est-il qu'on progresse et qu'on arrive à faire aujourd'hui ce qu'on pensait impossible il y a 10 ans (gagner au Go et aux jeux "stratégiques"). Le terme IA est biaisé et à la fin ce ne sont que des algo. Mais entre la puissance des ordi de maintenant et l'amélioration de ces algo, les champs des possibles sont plutôt sympa je trouve :mrgreen:
26/01/2019, 19h00
codec_abc

Citation:

Envoyé par Uther

Tu es sur de ce que tu avances ?
Autant je suis d'accord qu’au niveau efficacité l'IA n'étant pas l'imité par l'IHM, elle a probablement 100% de ses actions efficace. Par contre j'avais lu que le nombre d'APM était bien en dessous d'un joueur humain pro.

Elle est en dessous en moyenne. Sur les moments clés elle monte bien à 1500 APMs, la preuve sur la vidéo de DeepMind.

D'ailleurs, il y a un passage ou un joueur pro dit "It's micro [NDLR:AlphaStar] starts to get ridiculous" ce qui veut dire que son micro management d'unités est tellement bon que ça en devient ridicule/risible.
28/01/2019, 10h49
arond

après il serait important de préciser que l'IA a fait deux types de matchs premier type de match l'IA a accès à une vision de toute la carte l'humain c'est fait rouler dessus.

Deuxième type de match ou le broullard de guerre était en place la l'ia a perdu un match sur 5:D
28/01/2019, 14h24
darklinux

Citation:

Envoyé par codec_abc

Elle est en dessous en moyenne. Sur les moments clés elle monte bien à 1500 APMs, la preuve sur la vidéo de DeepMind.

D'ailleurs, il y a un passage ou un joueur pro dit "It's micro [NDLR:AlphaStar] starts to get ridiculous" ce qui veut dire que son micro management d'unités est tellement bon que ça en devient ridicule/risible.

Google à limité ces APM ... AlphaStar à de la marge , il peux encore grimpé , pas un coréen de 22 ans s ' entraînant 18 heures sur vingt quatre , une IA ne connais ni la fatigue , ni la faim , ni l '' envie de sexe ... l ' IA gagne au finish . Je ne pense pas que l ' IA finisse en buzzwords à la mode blockchain .
30/01/2019, 00h33
CoderInTheDark

Pardon, je suis quand même curieux de savoir comment il joue.
Moi j'avai joué à Starcraft et broodwar.

Et si sa méthode c'est de prendre les zerg et de produire un max dd'unité et d'attaquer dès le début c'est pas forcément glorieux.
Moi ça m'agaçait ce jeu sans finesse stratégique
30/01/2019, 14h16
Uther

Se limiter au rush zergling ultra-rapide, ça marche bien contre les débutants, mais ça ne peut pas marcher sur des professionnels. Au contraire, une fois que tu as appris a gérer ça, et que tu t'y attend, c'est une victoire facile.

Ce genre de technique d'attaque rapide (on appelle ça un cheese) peut éventuellement être utilisé à haut niveau pour surprendre un adversaire imprudent. Mais un humain, comme une IA, qui jouerait avec une seule stratégie est plutôt facile a contrer.

En l’occurrence, l'IA a joué des parties plutôt classiques avec des valeurs d'armées moyennes.
02/02/2019, 22h40
Matthieu Vergne

Je n'ai jamais joué à Starcraft (bien que je connaisse le principe par d'autres jeux du même style). Ce n'est d'ailleurs pas mon style de jeu donc je n'ai aucune compétence pour juger de la qualité de jeu autrement qu'en disant qui a battu qui. Cela dit, j'ai lu l'article et regardé la vidéo, et plusieurs points sont à relever.

Tout d'abord, un résumé du contexte :
- le jeu s'est déroulé avec 1 seule race (les Protoss)
- le jeu s'est déroulé sur 1 seule map (Catalyst LE)
- l'IA a été entraînée au préalable
- 5 parties ont d'abord été jouées contre un pro Zerg, qui a accepté de jouer Protoss
- l'IA a encore été entraînée
- 5 parties ont ensuite été jouées contre un pro Protoss

De là on peut déjà en tirer plusieurs points :
- aucun avantage particulier lié à des choix avant partie (e.g. choix des races, de la carte, etc.) et tout est connu à ce niveau là, à contrario d'une partie typique j'imagine. On enlève donc des inconnues des deux côtés, joueur comme IA.
- l'IA est par contre hyper spécialisée pour 1 race et 1 carte. Il y a fort à parier qu'à quantité d'entraînement équivalent, elle aurait été moins performante si elle avait dû apprendre sur plusieurs maps et pour plusieurs races (surtout avec la combinatoire). Est-ce que ça aurait fait une différence dans qui gagne à la fin, ça par contre on ne peut pas le savoir.
- le pro Zerg avait un handicap alors que le pro Protoss n'en avait pas, on pouvait donc s'attendre à un meilleur résultat humain dans le second cas mais, avec l'entraînement supplémentaire entre parties, rien n'était moins sûr.

Les résultats ont été les suivants :
- AlphaStar a battu le pro Zerg 5-0
- AlphaStar a battu le pro Protoss 5-0

Dans les faits, c'est donc une victoire écrasante.

Cependant, la vidéo annonce bien des subtilités d'AlphaStar :
- AlphaStar avait une vision d'ensemble de la map, pas une vision caméra. Les actions de l'IA sont montrés avec un "équivalent caméra", où ils plaçaient la caméra là où l'IA jouait pour faire comme si, et on pouvait voir par exemple que l'IA faisait des allers retours extrêmement brefs entre un combat et sa base.
- Bien qu'on parle d'AlphaStar au singulier, le fait est que chacune des 5 parties était une instance différente d'AlphaStar. En l'occurrence, les gens de DeepMind savait qu'ils allaient faire 5 parties, et ils ont donc pris 5 instances parmi leur top, une pour chaque partie. De fait, le seul joueur humain a joué contre 5 joueurs IA, chacun spécialisé dans une stratégie différente.
- L'entraînement d'AlphaStar était équivalent à 200 ans de jeu avant le pro Zerg. Il a été poursuivi avant de jouer contre le pro Protoss.
- L'IA a montré par moment une micro-gestion qu'un humain n'aurait sans doute pas pu faire (si j'en crois les commentateurs), tel qu'encercler un groupe d'unités ennemies en l'attaquant sur 3 fronts à la fois, avec une micro-gestion très efficace sur les 3 fronts en même temps.
- Une dernière partie a été jouée en bonus contre le pro Protoss, où ils ont repris une version entraînée depuis zéro et avec la caméra en plus à gérer. DeepMind affirme que, selon leur méthode d'évaluation, elle a atteint le même niveau que les autres, mais se ils refusent à affirmer que ce soit une preuve de performance équivalente. L'humain a gagné, mais impossible donc de dire si c'était une exception, si c'était à cause de la remise à zéro, ou si c'était à cause du "fardeau" supplémentaire de la caméra.

Ce que j'en retiens :
- des avantages machines restent à retirer pour la rendre comparable à un humain
- l'hyper spécialisation de l'IA (race, map, stratégie) était clairement en sa faveur.
- la quantité d'entraînement de l'IA est sans commune mesure avec celle d'un humain.

En bref, AlphaStar est ici un joueur hyper spécialisé de 200 ans d'expérience, avec encore des avantages machine. Il n'y a donc aucune honte à perdre contre un monstre pareil.

Que dire quant aux avancées en IA ?
- Par ces résultats, DeepMind montre qu'une IA est capable d'obtenir une expertise de jeu de très bon niveau sur un jeu de type StarCraft.
- Néanmoins, avant de pouvoir dire qu'il bat l'humain à StarCraft, il y a de la combinatoire à rajouter. Notamment, il faudrait n'avoir qu'une seule instance, capable de jouer n'importe quelle race, contre n'importe quelle race, sur n'importe quelle map. C'est d'ailleurs leur objectif actuel.
- En terme d'intelligence par contre, ça ne montre rien du tout : faire jouer un humain de quelques dizaines d'années d'expérience contre un humain de plus de 200 ans cumulé, personne ne s'étonnerait de voir gagner le second. Il faudra gagner avec une quantité d'entraînement comparable avant de pouvoir dire que l'IA atteint un niveau humain.
03/02/2019, 11h48
LittleWhite

Bonjour,

Petit bémol par rapport à ce que vous dites, Matthieu Vergne : un joueur (pro) a une race de prédilection et ne s’entraîne et ne joue qu'avec celle-ci. Donc, pour moi, l'IA n'a pas besoin d'apprendre à gérer les trois races du jeu pour pouvoir être sur le même pied d'égalité que le joueur humain. Qui plus est, si l'IA prend aléatoire comme race, le joueur humain aura une difficulté supplémentaire (le temps perdu à découvrir quel est son ennemi).
04/02/2019, 16h04
Stéphane le calme

2 pièce(s) jointe(s)

AlphaStar, la nouvelle IA de DeepMind qui a battu deux des meilleurs joueurs de Starcraft II
AlphaStar, l'IA de DeepMind qui a battu deux des meilleurs joueurs de Starcraft II,
a eu "jusqu'à" 200 ans d'entraînements en gameplay virtuel

DeepMind, la startup de l'IA acquise par Google en 2014, est probablement mieux connue pour avoir créé la première intelligence artificielle à battre un champion du monde au jeu de Go. Alors, que faites-vous après avoir maîtrisé l'un des jeux de société les plus difficiles au monde ? Vous abordez un jeu vidéo complexe. Plus précisément, DeepMind a décidé de développer une IA pour jouer au jeu de stratégie en temps réel StarCraft II.

StarCraft exige des joueurs qu’ils rassemblent des ressources, construisent des dizaines d’unités militaires et les utilisent pour tenter de détruire leurs adversaires. StarCraft est particulièrement difficile pour une IA car les joueurs doivent exécuter des plans à long terme sur plusieurs minutes de jeu, les peaufinant à la volée face aux contre-attaques ennemies. DeepMind a déclaré qu’avant ses propres efforts, personne n’était parvenu à concevoir une intelligence artificielle StarCraft aussi performante que les meilleurs joueurs.

La nécessité d'équilibrer les objectifs à court et à long terme et de s'adapter aux situations imprévues pose un défi de taille aux systèmes souvent fragiles et inflexibles. La maîtrise de ce problème nécessite des avancées dans plusieurs défis de la recherche sur l'IA, notamment dans :
- la théorie du jeu : StarCraft est un jeu où, à la différence du chifoumi (pierre-papier-ciseaux, il n'y a pas de meilleure stratégie. En tant que tel, un processus de formation à l'IA doit continuellement explorer et élargir les frontières de la connaissance stratégique.
- Informations imparfaites : contrairement aux jeux comme les échecs ou Go où les joueurs voient tout, les informations cruciales sont cachées aux joueurs de StarCraft et doivent être activement découvertes en effectuant des « reconnaissances ».
- Planification à long terme : comme beaucoup de problèmes concrets, les causes et effets ne sont pas instantanés. Les jeux peuvent également prendre jusqu’à une heure, ce qui signifie que les actions entreprises au début du jeu risquent de ne pas être rentables avant longtemps.
- Temps réel : contrairement aux jeux de société traditionnels où les joueurs alternent les mouvements subséquents, les joueurs de StarCraft doivent effectuer des actions de manière continue au fur et à mesure que le chronomètre avance.
- Grand espace d'action : des centaines d'unités et de bâtiments différents doivent être contrôlés simultanément, en temps réel, créant ainsi un espace combinatoire de possibilités. De plus, les actions sont hiérarchiques et peuvent être modifiées et augmentées.
Pièce jointe 447328

En raison de ces immenses défis, StarCraft est devenu un « grand défi » pour la recherche sur l'IA.

DeepMind a annoncé avoir battu deux des meilleurs joueurs de StarCraft

Jeudi dernier, DeepMind a annoncé une avancée significative. La société a opposé son IA, baptisée AlphaStar, à deux des meilleurs joueurs de StarCraft - Dario "TLO" Wünsch et Grzegorz "MaNa" Komincz. AlphaStar a remporté une série de cinq matchs contre Wünsch 5-0, puis a battu Komincz 5-0.

Pièce jointe 447324

Citation:

Envoyé par DeepMind

Ces dernières années, StarCraft, considéré comme l'un des jeux de stratégie en temps réel (RTS) les plus difficiles et l'un des sports les plus joués de tous les temps, s'est imposé par consensus comme un « grand défi » pour la recherche sur l'IA.

Nous présentons maintenant notre programme StarCraft II, AlphaStar, la première intelligence artificielle à vaincre un joueur professionnel de haut niveau. Lors d'une série de matches d'essai qui s'est déroulée le 19 décembre, AlphaStar a remporté une victoire décisive face au Grzegorz "MaNa" Komincz, de l'équipe Liquid, 5-0, à la suite d'un match de référence contre son coéquipier Dario "TLO" Wünsch. . Les matches se sont déroulés dans des conditions de match professionnelles sur une carte en échelle de compétition et sans aucune restriction de jeu.

Bien que les jeux vidéo tels qu'Atari, Mario, Quake III Arena Capture du drapeau et Dota 2 aient connu un succès considérable, les techniques de l'intelligence artificielle ont jusqu'à présent eu du mal à faire face à la complexité de StarCraft. Les meilleurs résultats ont été rendus possibles par la fabrication manuelle d’éléments majeurs du système, l’imposition de restrictions importantes aux règles du jeu, la fourniture de capacités surhumaines au système ou la lecture de cartes simplifiées. Même avec ces modifications, aucun système n’a réussi à rivaliser avec les compétences des joueurs professionnels. En revanche, AlphaStar joue à StarCraft II dans son intégralité, en utilisant un réseau de neurones profonds entraîné directement à partir de données brutes de jeu, par apprentissage supervisé et renforcement.

AlphaStar a été formé en utilisant "jusqu'à 200 ans" de gameplay virtuel

Le comportement d’AlphaStar est généré par un réseau de neurones profonds qui reçoit des données d’entrée de l’interface de jeu brute (une liste des unités et de leurs propriétés) et émet une séquence d’instructions constituant une action dans le jeu.

AlphaStar utilise également un nouvel algorithme d’apprentissage multi-agents. Le réseau de neurones a été initialement formé par apprentissage supervisé à partir de jeux humains anonymisés publiés par Blizzard. Cela a permis à AlphaStar d’apprendre, par imitation, les stratégies de base micro et macro utilisées par les joueurs à l’échelle de StarCraft. Cet agent initial a vaincu l'IA intégrée de niveau « Elite » - autour du niveau de l'or pour un joueur humain - dans 95% des matchs.

Citation:

Envoyé par DeepMind

Afin de former AlphaStar, nous avons développé une configuration de formation distribuée hautement évolutive à l'aide des TPU v3 de Google, qui prend en charge une population d'agents apprenant à partir de plusieurs milliers d'instances parallèles de StarCraft II. La ligue AlphaStar a duré 14 jours, avec 16 TPU pour chaque agent. Pendant la formation, chaque agent a connu jusqu'à 200 ans de jeu StarCraft en temps réel. L'agent final AlphaStar comprend les composants de la distribution Nash de la ligue - en d'autres termes, le mélange le plus efficace de stratégies découvertes - fonctionnant sur un seul GPU desktop.

En somme, le processus a commencé par l'utilisation de l'apprentissage supervisé pour aider les agents à apprendre à imiter les stratégies des joueurs humains. Cette technique d’apprentissage par renforcement était suffisante pour construire un bot StarCraft II compétent. DeepMind dit que cet agent initial « a vaincu l'IA intégrée du niveau Elite - autour du niveau de l'or pour un joueur humain - dans 95% des matchs »

DeepMind a ensuite divisé cette IA initiale en plusieurs variantes, chacune avec un style de jeu légèrement différent. Tous ces agents ont été jetés dans une ligue virtuelle StarCraft, chaque agent jouant avec les autres joueurs 24 heures sur 24, apprenant de leurs erreurs et faisant évoluer leurs stratégies au fil du temps.

« Pour encourager la diversité dans la ligue, chaque agent a son propre objectif d'apprentissage: par exemple, quels concurrents cet agent devrait-il viser, et toutes motivations internes supplémentaires qui biaisent la façon dont l'agent joue », explique DeepMind. « Un agent peut avoir pour objectif de vaincre un concurrent spécifique, tandis qu'un autre peut devoir vaincre toute une distribution de concurrents, mais en construisant davantage d'une unité de jeu particulière ».

Selon DeepMind, certains agents ont gagné l'équivalent de 200 ans de pratique en jouant à StarCraft contre d'autres agents. Sur une période de deux semaines, ce processus darwinien a considérablement amélioré les compétences moyennes des agents:

Au terme de ce processus, DeepMind a sélectionné cinq des agents les plus puissants de sa ménagerie virtuelle pour affronter les challengers humains d'AlphaStar. Une conséquence de cette approche est que les joueurs humains été confrontés à une stratégie différente lors de chaque match contre AlphaStar.

Source : DeepMind

Et vous ?

:fleche: Le combat était-il équitable selon vous ou l'IA disposait-elle d'avantages ?

Voir aussi :

:fleche: Unity lancera bientôt un challenge axé sur l'intelligence artificielle au travers d'un jeu pour repousser les limites des systèmes intelligents
:fleche: La révolution de l'automatisation et de l'intelligence artificielle sera surtout néfaste pour les hommes, selon une analyse
:fleche: « L'intelligence artificielle n'existe pas et la voiture autonome n'existera jamais », selon un expert en IA
:fleche: RITME organise un atelier sur la programmation parallèle et l'intelligence artificielle, les 6 et 7 février 2019 en Belgique
:fleche: Dans l'hôtel futuriste d'Alibaba, le personnel est en supplément, l'hôtel étant géré par l'intelligence artificielle
04/02/2019, 17h13
Dgamax

Même si ils ont limité les APM, les 10 match en off qui se sont déroulé chez Deepmind en Angleterre, Alphastar a gagné 10/0, mais il avait un accès global de toute la map (sauf celle couverte par le brouillard de guerre) donc en plus d'avoir un microgestion parfaite, elle pouvait et c'est ce qu'elle a fait, attaquer sur plusieurs front en même temps sans devoir repositionner la camera car elle avait la vue total de la map.

Par contre, le match qui était en live contre MaNa, celle-ci a été entraîné différemment, elle était limité à la même vision que MaNa et cette fois-ci MaNa a remporté la victoire.

Au niveau de la microgestion il n'y a rien d'impressionnant, c'est une machine, même si Alphastar tourne sur un simple laptop, le temps réponse comparé à un être humain est bien meilleur donc ça pas de surprise.
04/02/2019, 17h37
Doksuri
pareil, j'ai ete surpris de voir que sont APM (actions par minutes) n'etait pas deconnant (et etait souvent plus bas que l'humain)

j'ai pas regarde tous les matchs (pas le temps) mais de ce que j'ai vu, c'est ce que pourrait faire n'importe qui :
- AlphStar met la pression a son ennemi (juste a la sortie de sa base) ce qui lui permet de scout (decouvrir) les unites (et la quantite) de l'autre => et reagir en consequent (produire l'unite de contre)
- en parallele, AlphaStar semble avoir une notion de succes du combat (il possede X,Y,Z unites, j'en possede A,B,C ... j'ai 90% de chances de perdre)
- AlphaStar utilise au mieux ses ressources (production en continue)
- s'il ne peut plus mettre la pression, il rentre defendre sa base.
- lors des combats, il place au mieux ses unites et attend que l'autre s'ecrase contre lui
le probleme du cerveau humain, c'est qu'on a un nombre limite de TODO a checker en continue (verifier qu'on utilise bien toutes nos ressources, verifier la mini-map, verifier que nos unites sont bien places, quelles unites produire, quels batiments construires, verifier que ci, que ca...) et quand arrive un combat, on perd le fil de cette TODO
=> AlphaStar ne se rate jamais sur ces TODOs

l'autre probleme et qu'on a une moins bonne estimation de l'issue d'un combat

de plus, je n'ai pas l'impression qu'il "triche" comme on pourrait l'entendre : j'ai l'impression qu'il detecte sur la mini-map, un point ennemi : il deplace la camera dans la zone pour "voire" ce que c'est.
04/02/2019, 17h45
fredoche

ma petite pensée philosophique du jour :
ce sont des jeux de guerre, de stratégie militaire certes SF et virtuels, mais guerre, bataille, boum boum, conquête, etc.
Battre, écraser, vaincre, tuer, massacrer, encercler

Qui appelle ça de l'intelligence ? Qui ?

Du temps où les échecs étaient rois, les grands joueurs n'étaient pas forcément très intelligents de manière générale, mais ils développaient un don, des capacités cognitives (comme d'autres le calcul mental ou les langues), une spécialisation.

Des gars comme Vinci, Einstein, Pythagore, Euclide étaient intelligents. L'intelligence c'est de résoudre utilement des problèmes, apporter de nouveaux outils, découvrir de nouvelles facettes, augmenter "le monde".

Quand est-ce qu'on met ces fameuses IA à bosser sur le traitement de la leucémie ou du paludisme ?

Parce que sinon c'est juste de la branlette, et de bons scénarios à la terminator.
04/02/2019, 17h54
LittleWhite

Bonjour,

Je souhaiterai répondre à fredoche.
Il est possible de considérer les jeux sous la forme suivante : un jeu vidéo n'est qu'une problématique présentée au joueur, problématique qu'il doit résoudre pour accéder à une récompense (la fin du jeu, souvent).
Dans Mario, le joueur doit aller à droite (fin du niveau). Pour cela il peut sauter et courir. Il faut faire preuve d'une certaine capacité cognitive (synchronisation des yeux et mains, reflex, mémoire...) pour réussir.
Dans Starcraft, on démarre avec quatre récolteurs. Il faut écraser son ennemi. Du coup, il faut monter une armée (une armée efficace pour battre l'ennemi et non pas juste une "grosse" armée), lui donner des ordres précis et pointus, gérer ses ressources et son extension. Bref, cela demande (d'après moi) des capacités plus élevés que Mario.

Et pour moi, Starcraft est une évolution du jeu d'échec. Un jeu d'échec sur une carte plus grande, avec des ressources à gérer, de la production à gérer, mais dans l'idée, cela reste de la stratégie et cela reste qu'il faut battre l'adversaire (en détruisant ses pièces).

Et puis, on a déjà mis les IA sur des sujets "plus utiles d'après vous" : http://www.developpez.com/actu/23971...lon-une-etude/ .
04/02/2019, 18h05
onilink_

Citation:

Envoyé par Dgamax

Au niveau de la microgestion il n'y a rien d'impressionnant, c'est une machine, même si Alphastar tourne sur un simple laptop, le temps réponse comparé à un être humain est bien meilleur donc ça pas de surprise.

C'est tellement peu impressionnant qu'il a fallu attendre 2019 (soit près d'une décennie après la sortie du jeu) pour faire une IA capable de battre des joueurs d'élite.

J'imagine qu'alpha go est encore moins impressionnant à vos yeux.
C'est tellement trivial comme jeu pour une machine.
04/02/2019, 18h24
marsupial

Citation:

Envoyé par Stéphane le calme

:fleche: Le combat était-il équitable selon vous ou l'IA disposait-elle d'avantages ?

L'IA disposait d'avantages comme référencés par Matthieu Vergne mais il s'agit d'un gigantesque bond en avant pour une machine. Qui peut se targuer d'avoir battu des joueurs pros avec une machine ? Bien que Deep Mind n'ait plus rien à prouver suite à son triomphe au jeu de Go contre les meilleurs joueurs, ils font progresser la recherche dans le domaine du jeu. Une IA qui challenge l'humain dans un jeu le rend plus intéressant.

Et comme dit par Little White, l'IA performe dans d'autres domaines que le jeu. Et là qui se plaindra que l'IA utilise tous les avantages d'une machine pour poser un diagnostic précoce pour un meilleur traitement ?
04/02/2019, 18h31
fredoche

Littlewhite, je connais bien Mario et Starcraft, je suis un vieux joueur, je pourrais en raconter autant que le joueur du grenier si ça se trouve.

Mais ça me rappelle les exploits Deepblue contre Kasparov de l'époque. Je trouve ça tellement limité cette notion d'intelligence dans ces contextes, aussi artificielle soit-elle.

J'avais envie de le dire, histoire de récolter une bonne tournée de pouces rouges, alors Go ! :mouarf: Niet pas le jeu

Kasparov sait nouer ses lacets tout seul et a été un des premiers opposants à Poutine, voilà de la vraie intelligence.
04/02/2019, 19h18
thelvin

Citation:

Envoyé par onilink_

C'est tellement peu impressionnant qu'il a fallu attendre 2019 (soit près d'une décennie après la sortie du jeu) pour faire une IA capable de battre des joueurs d'élite.

Apparemment, la micro, ça ne fait pas absolument tout le jeu. Par exemple, aussi bonne soit-elle en micro, si une IA envoie ses récolteurs attaquer l'ennemi dès le début du jeu, elle se fera rétamer par un progamer (mais peut-être pas par moi, ridicule petit rang Argent.)

Autrement dit, si le pro tient assez longtemps face à l'invraisemblable force d'une parfaite microgestion, sa capacité à élaborer des stratégies qui défoncent complètement le plan de développement que l'autre a suivi jusque-là, lui donnera l'avantage et la victoire. Ça, on peut penser qu'une IA ne pouvait pas le faire, ou en tout cas que c'était assez compliqué, surtout avec informations incomplètes.

Du coup, ça change de voir maintenant une IA qui, face à un pro qui a survécu assez longtemps, ne se trouve pas spécialement dérangée et continue de profiter allégrement de son avantage écrasant en microgestion.

Mais il faut pas se leurrer. La partie microgestion, Blizzard pouvait fournir des IA qui fassent aussi bien dès le début (même mieux, en fait, car AlphaStar a souvent tendance à décimer ses propres troupes avec des AoE, ce qui assez souvent ne pouvait pas avoir de bon côté. Avec ça, on voit au moins qu'ils n'ont pas cherché à lui programmer sa microgestion. C'est un acquis tiré de l'apprentissage avec des défauts bien réels, mais qui toutefois ne pèsent pas assez dans la stratégie résultante pour vouloir les corriger.) Alors pourquoi on a pas eu une IA avec une si formidable micro jusque-là ? Mais parce que, quel intérêt ? Qui en doute, du fait que la machine nous surclasse plus qu'on ne peut même le concevoir sur les travaux logiques et rapides ? Quelqu'un qui n'a jamais tenu une calculette ?

Les IA de Starcraft ne poussent pas trop loin leur savoir-faire en microgestion, parce que ça n'intéressait personne qu'elles le fassent. Il n'y a qu'à voir l'invraisemblable frustration, quand MaNa s'est fait décimer son armée très largement supérieure, chose qu'aucun adversaire humain n'aurait pu lui faire dans une "vraie" partie. Une partie dans laquelle le rapport de force des unités a l'effet qu'il est censé avoir, et où donc son armée ne pouvait qu'écraser l'armée adverse. C'est possible de faire une IA qui fait tous les micros-choix nécessaires pour éliminer l'adversaire exactement de la manière qui permet de le faire. Mais, ça n'a aucun intérêt. Au départ c'est un jeu vidéo, qui se joue pour le plaisir.

Alors oui, les pros sont si forts que la seule micro quasi-parfaite d'une IA ne suffit pas pour les vaincre : ils survivront assez longtemps pour que ce soit la stratégie qui compte, et leur stratégie est bien plus forte qu'une IA programmée sans le meilleur savoir-faire. Mais ça ne veut pas dire qu'il existe un intérêt à fournir des IA avec une micro parfaite, et seulement ça. Il faut une IA qui peut en faire quelque chose au-delà de juste jouer au mieux les batailles dans lesquelles elle se retrouve. Il faut une IA qui soit celle qui décide avec quoi ses batailles se joueront, et qui le fasse bien. Ce n'est pas de la micro, ça.
04/02/2019, 19h48
Matthieu Vergne

Citation:

Envoyé par fredoche

Je trouve ça tellement limité cette notion d'intelligence dans ces contextes, aussi artificielle soit-elle.

Il faut savoir que le terme "intelligence" en IA est un buzzword marketing. Dans la quasi totalité des cas, on ne cherche pas à faire une machine intelligente, mais une machine experte dans une tâche bien précise. Si tu écoute ceux qui bossent directement sur ces technos, tu entendras parler de performance, efficience, efficacité, etc. mais quasiment jamais d'intelligence.
04/02/2019, 22h25
gallima

Est ce qu'il y a eu triche de la part de AlphaStar/Deepmind ?

1) Vision de toute la carte : C'est un avantage déterminant énorme.
2) Des piques à 1200action par minutes (APM) juste aux moments critiques, loin des 400 des humains. Et encore pour un humain à 400 il y a beaucoup de spams, moins du tiers sont des actions qui changent l'état du jeu; là où Deepmind fait des déplacements simultanés d'unité. Ce n'est pas le fait d'être à trois endroits en même temps qui pose un problème d'équité, c'est le fait de donner des ordres très précis de déplacement et de tir différentiés à chaque unité dans une grosse formation à 10 unités par secondes pendant les 3 secondes où se fait le match. Cette micro-maitrise des déplacements et attaques permet à l'IA de s'orienter vers des unités et style de jeu impraticable pour un humain. Ce n’est pas équitable.
3) Calcul au point de vie près de la survie des unités pour les déplacements: Alphastar ne manipule pas la sourie, il accède directement aux unités via son API, une grosse difficulté en moins; le clavier c'est moins gênant, mais dans l'absolu le problème est le même. Ce n’est pas équitable.
4) Une seul carte pour jouer ? Sérieusement il y en a plus de 200 dans le jeu. Même si l'humain sait quelle carte va sortir, on sait très bien qu'il ne peut pas réduire sa cervelle pour qu'elle tourne plus vite sachant la carte. Un ordinateur peut le faire par contre. Ce n’est pas juste.
5) Que de match Protoss contre Protoss ? Pourquoi ne pas autoriser les Terran et Zerg ? La diversité fait partie de la complexité. Ca perd de l’intérêt, honnêtement j'ai zappé des morceaux à cause de ça. Au moins avec Alphago cela ressemblait au go.
6) Pas un seul rush/cheese dans les stratégies de Mana, 10 matchs d'accords, mais 10 matchs copiés/collés. Pourquoi ? Un 'pro' ne ferait jamais ça. Perso si la plan A ne marche pas je fais le plan B, et les 'pro' on plein de plans. Qui a payé qui ? Que dit le contrat ?
7) Mana est un joueur pro, mais pas dans les 10 premiers. Dans le haut de la pyramide, le niveau monte de plusieurs crans, 500 points de MRR entre Mana(n°19) et Serral(n° 1); pas de sélection en tournoi majeur en 2018 : https://liquipedia.net/starcraft2/MaNa
8) A l'origine Deepmind avait annoncé qu'ils allaient créer un système qui apprendrait tout le jeu par l'écran la sourie et le clavier... Clairement l'objectif a été vite oublié ; ils ont entré les concepts du jeu dans l'IA, 'pylône', 'production', 'déplacement' etc... Les informations disponibles sont très ambigües sur l'intrusion humaine dans la programmation d'Alphastar. L'abstraction requise pour comprendre le jeu n'a pas été maitrisée, demain si le jeu évolue (comme il le fait souvent) Alphastar ne va pas s'adapter tout seul. Les capacités apprises par Alphastar ne sont vraisemblablement pas transposables à d'autres jeux de stratégies. Pour rappel, l'IA d'origine du jeu même en 'élite' ne ralentit pas du tout le fonctionnement du jeu et fonctionne sur un Hierchical Task Network qui pourrait aussi être amélioré; mais l'éditeur doit vouloir permet aux joueurs occasionnels de gagner. Si demain Alphastar doit jouer à Dune2, il faudra ré-encoder le jeu dans Dune2star, un humain maitriserait la différence en 2 ou 3 parties.

Dans le 11ieme matche, l'avantage numéro 1 est retiré et Alphastar/Deepmind fait n'importe quoi dès la première attaque par-derrière (pourtant très classique).

Si Alphastar est si forte alors pourquoi ne pas la lancer sur le ladder, je suis certain que beaucoup de joueurs lui feront un bon accueil.
Pour Deepmind, battre Mana lors d'un show truqué, c'est bien pour se faire un dernier coup de pub, avant de laisser tomber ce projet trop compliqué qui ne rapporte pas d'argent.
04/02/2019, 22h42
Matthieu Vergne

Au cas où tu n'aurais pas suivi, ce challenge arrive au milieu du projet. AlphaStar n'est pas terminé.

Tout comme pour le Go ils ont d'abord joué en 2015 contre un bon joueur accessible (européen) avec une version capable de bien jouer. Puis en 2016 ils ont joué contre le meilleur joueur du monde avec une version améliorée. Puis ils ont laissé tourner AlphaGo encore amélioré sur des serveurs de Go avant de l'arrêter. Au final, AlphaGo aura été battu par son successeur non-spécialisé AlphaZéro.

Le match StarCraft qui vient de se passer correspond au tout premier match. Ils n'ont pas visé le top mondial, mais de bons joueurs accessibles, avec une version exploitable qui avait des chances de gagner. Ils en sont encore au stade expérimental à voir jusqu'où ça va. Peut être que le prochain match sera avec les meilleurs du monde l'année prochaine, mais ce qui est sûr est qu'il planche encore sur l'amélioration d'AlphaStar, le 11e match ayant été fait avec une toute nouvelle version.
05/02/2019, 01h16
thelvin

Cela dit, on en arrive à ma première réaction devant la chose : c'est quoi l'intérêt de faire venir des pros, aussi accessibles soient-ils, et de publier les parties, pour affronter une version qui ne joue qu'une race, qu'une carte, et à l'API ?

Il y avait pas assez de master leagues auxquels demander un petit match amical discret, pour se faire une idée de ce que ça donne contre un humain pas trop manchot, non ?

De fait, je vois mal ce que c'est d'autre que du buzz.

J'ai, par contre, de gros doutes concernant l'idée qu'ils en resteront là. Une IA qui poutre les humains à Starcraft 2 avec n'importe quel matchup, sur n'importe quelle map y compris une qu'elle connaît pas, et en lisant les pixels et bougeant une souris/appuyant sur un clavier, eh ben on l'a pas encore. Et il y a du boulot. De là à ce que ce soit si loin que ça... Bon, ça reste compliqué à monnayer alors peut-être qu'ils s'arrêteront avant. Mais j'en doute. C'est compliqué de faire partir un moteur Alpha de DeepMind, mais ils ont montré que quand c'est parti, ça finit par atteindre ses objectifs, et montrer la supériorité de la machine à règles égales.
05/02/2019, 06h25
darklinux

Citation:

Envoyé par fredoche

ma petite pensée philosophique du jour :
ce sont des jeux de guerre, de stratégie militaire certes SF et virtuels, mais guerre, bataille, boum boum, conquête, etc.
Battre, écraser, vaincre, tuer, massacrer, encercler

Qui appelle ça de l'intelligence ? Qui ?

Du temps où les échecs étaient rois, les grands joueurs n'étaient pas forcément très intelligents de manière générale, mais ils développaient un don, des capacités cognitives (comme d'autres le calcul mental ou les langues), une spécialisation.

Des gars comme Vinci, Einstein, Pythagore, Euclide étaient intelligents. L'intelligence c'est de résoudre utilement des problèmes, apporter de nouveaux outils, découvrir de nouvelles facettes, augmenter "le monde".

Quand est-ce qu'on met ces fameuses IA à bosser sur le traitement de la leucémie ou du paludisme ?

Parce que sinon c'est juste de la branlette, et de bons scénarios à la terminator.

C 'est un exercice comme un autre , non ce n 'est de pas de la branlette , mais les échecs , c 'est so Deep Blue . tu as raison d ' appuyer sur le côté show business des parties Deep Mind , mais ce n 'est qu ' une démo , cela aurais moins spectaculaire avec Skyrim ou Sim City 4 . Pour l ' instant , l ' IA est au même stade que Visicalc au début des années 1980 . Nous y viendront à la guérisons des maladies , des IA tournent actuellement sur le sujet . il revient à l ' Homme de vouloir améliorer son environnement , pas aux machines
05/02/2019, 08h59
gallima

Citation:

Envoyé par Matthieu Vergne

Au cas où tu n'aurais pas suivi, ce challenge arrive au milieu du projet. AlphaStar n'est pas terminé.

Effectivement je n'ai pas vu cette partie là. Le projet devait durer 4 ans et nous n'en sommes que à 2 ans, mais par ailleurs leur communiqué est du genre : 'mission accompli nous pouvons passer à autre chose'.
Si tu as une référence montrant qu'ils continuent les développements alors j'en suis preneur.
Je lis les articles qui proviennent de deepmind pour mon taf, et je n'ai rien vu qui puisse servir à compenser les points 1 & 8, sachant que de nombreux autres points manque vraiment de fair-play.
Mais s'ils savent le faire et qu'ils publient là dessus, alors j'ai plein d'application(non guerrière) pour ce genre de techno.
05/02/2019, 15h25
Dgamax

Citation:

Envoyé par onilink_

C'est tellement peu impressionnant qu'il a fallu attendre 2019 (soit près d'une décennie après la sortie du jeu) pour faire une IA capable de battre des joueurs d'élite.

J'imagine qu'alpha go est encore moins impressionnant à vos yeux.
C'est tellement trivial comme jeu pour une machine.

Oui il n'y a rien d'impression au niveau de la microgestion, c'est extrêmement simple pour une machine de cliquer au pixel près en quelques ms alors que pour un être humain c'est impossible.
Il n'a pas fallu une décennie pour ça, l'IA du jeu peu très bien le faire.

Deepmind n'a pas commencé à travailler la dessus dès la sortie de SC2, ils ont commencé quand Blizzard a sortie des API soit en 2017.

La seule chose impressionnante, c'est le système d'apprentissage renforcé et encore, il a quand même fallu 200ans de temps de jeu pour arriver au niveau d'un pro pour gagner 10/0 en ayant accès à toute la map sans devoir faire de scolling, puis à nouveau 200ans pour apprendre à jouer dans les même conditions de jeu que MaNa, pour au final perdre contre lui.
05/02/2019, 15h34
Dgamax

Citation:

Envoyé par fredoche

Littlewhite, je connais bien Mario et Starcraft, je suis un vieux joueur, je pourrais en raconter autant que le joueur du grenier si ça se trouve.

Mais ça me rappelle les exploits Deepblue contre Kasparov de l'époque. Je trouve ça tellement limité cette notion d'intelligence dans ces contextes, aussi artificielle soit-elle.

J'avais envie de le dire, histoire de récolter une bonne tournée de pouces rouges, alors Go ! :mouarf: Niet pas le jeu

Kasparov sait nouer ses lacets tout seul et a été un des premiers opposants à Poutine, voilà de la vraie intelligence.

Deepblue et AlphaGo ou Alphastar ne fonctionnent pas de la même façon.
Deepblue calculé tous les coups possibles et demandé un supercalculateur pour jouer aux échec.
L'alpha team, tourne sur un PC portable classique et se sert de sa connaissance pour s'adapter face à ses concurrents.

Le seul point commun c'est que les chercheurs n'étaient pas des grands joueurs d'échec, go ou sc2.

Sinon, ça signifie quoi pour toi l’intelligence artificielle ?
05/02/2019, 17h05
fredoche

Citation:

Envoyé par Dgamax

Sinon, ça signifie quoi pour toi l’intelligence artificielle ?

Hé bien en préambule j'adhère beaucoup à ce qu'a dit Mathieu, qui l'a dit de manière beaucoup plus élégante et directe que ce que je suggérais

Citation:

Envoyé par Matthieu Vergne

Il faut savoir que le terme "intelligence" en IA est un buzzword marketing. Dans la quasi totalité des cas, on ne cherche pas à faire une machine intelligente, mais une machine experte dans une tâche bien précise. Si tu écoute ceux qui bossent directement sur ces technos, tu entendras parler de performance, efficience, efficacité, etc. mais quasiment jamais d'intelligence.

Et je comprends le besoin de marketing, de démontrer des résultats, on est tous tenu à ça quelque part

Si je devais définir intelligence, l'un des mots basiques que je pourrais employer c'est capacité d'adaptation.
Connaissant un peu la neurologie et la psychophysiologie je crois que nous sommes toujours très loin de pouvoir reproduire de manière numérique le fonctionnement des axones et dendrites des neurones du néocortex des mammifères, leur formidable plasticité, la richesse de comportement qu'offrent les neuro-transmetteurs... Mais bref on s'en fout pas mal.

Citation:

Envoyé par Dgamax

Deepblue et AlphaGo ou Alphastar ne fonctionnent pas de la même façon.
Deepblue calculé tous les coups possibles et demandé un supercalculateur pour jouer aux échec.
L'alpha team, tourne sur un PC portable classique et se sert de sa connaissance pour s'adapter face à ses concurrents.

Le seul point commun c'est que les chercheurs n'étaient pas des grands joueurs d'échec, go ou sc2.

Sinon, ça signifie quoi pour toi l’intelligence artificielle ?

Alors oui mais en réalité non :
- 200 ans d'apprentissage sur les TPU google, c'est aussi 200 ans de parties d'échecs stockées dans les mémoires de Deepblue. De mes souvenirs celui-ci avait été nourri de toutes ls parties d'échecs de grand maitres du 19e et 20 e siècle répertoriées, et c'était la mode de conserver ces traces à l'époque, toujours d'ailleurs
ici https://en.wikipedia.org/wiki/Deep_B...hess_computer) on lit :

Citation:

Deep Blue's evaluation function was initially written in a generalized form, with many to-be-determined parameters (e.g. how important is a safe king position compared to a space advantage in the center, etc.). The optimal values for these parameters were then determined by the system itself, by analyzing thousands of master games. The evaluation function had been split into 8,000 parts, many of them designed for special positions. In the opening book there were over 4,000 positions and 700,000 grandmaster games.

Juste pour les ouvertures donc.
et pour Alphastar :

Citation:

In order to train AlphaStar, we built a highly scalable distributed training setup using Google's v3 TPUs that supports a population of agents learning from many thousands of parallel instances of StarCraft II. The AlphaStar league was run for 14 days, using 16 TPUs for each agent. During training, each agent experienced up to 200 years of real-time StarCraft play. The final AlphaStar agent consists of the components of the Nash distribution of the league - in other words, the most effective mixture of strategies that have been discovered - that run on a single desktop GPU.

- Deep blue c'est de la force brute, de l'analyse en // à haute vitesse. Deep blue est donné à 11,4 GFlop/s.
Et dans le texte précédent je lis : in other words, the most effective mixture of strategies that have been discovered - that run on a single desktop GPU.
Et par curiosité j'ouvre le site Nvidia, je vois l'encart sur la carte graphique la plus rapide jamais conçue (jusqu'à la prochaine hein :D) : 130 TFlops Tensor https://www.nvidia.com/fr-fr/titan/titan-rtx/
Je ne sais pas si Tensor du sens dans ce contexte , mais sinon 130 TFlops, c'est juste (130*1000)/11,4=11403 Deep Blue dans une carte graphique. C'est pas de la force brute les algos, mais il y a de quoi faire quand même.

Ca tourne vraiment sur un portable ? j'ai pas trouvé d'infos à ce sujet, sans trop chercher cela dit
05/02/2019, 18h50
Matthieu Vergne

Citation:

Envoyé par gallima

Si tu as une référence montrant qu'ils continuent les développements alors j'en suis preneur.

Regarde la vidéo du match (pas le dernier article, celui d'avant). Les commentaires des gens de DeepMind m'ont laissé comprendre qu'il travaillaient encore activement dessus, notamment quand ils ont parlé d'intégrer la caméra car elle n'en avait pas lors des matchs. D'ailleurs, vu qu'ils ont fait un match bonus avec une toute nouvelle version intégrant justement la caméra, ça montre qu'ils bossent encore dessus. S'ils avaient considéré être à la fin, ils auraient attendu d'avoir la version finale avant de faire les matchs. De plus, comme expliqué précédemment, ça suit le même chemin que les matchs d'AlphaGo. Mon impression d'ensemble est donc que ce n'est pas terminé.

Citation:

Envoyé par fredoche

Ca tourne vraiment sur un portable ? j'ai pas trouvé d'infos à ce sujet, sans trop chercher cela dit

C'est ce qu'ils ont affirmé lors de la présentation des matchs, voire la vidéo. De souvenir, que ça tournerait sur une machine personnelle décente. Dans les faits, c'est l'entraînement qui a besoin de puissance. Le réseau de neurones, une fois entraîné, ça va plutôt vite si on exploite bien sa machine.
05/02/2019, 18h52
Dgamax

Citation:

Envoyé par fredoche

Alors oui mais en réalité non :
- 200 ans d'apprentissage sur les TPU google, c'est aussi 200 ans de parties d'échecs stockées dans les mémoires de Deepblue. De mes souvenirs celui-ci avait été nourri de toutes ls parties d'échecs de grand maitres du 19e et 20 e siècle répertoriées, et c'était la mode de conserver ces traces à l'époque, toujours d'ailleurs
ici https://en.wikipedia.org/wiki/Deep_B...hess_computer) on lit :
Juste pour les ouvertures donc.
et pour Alphastar :

- Deep blue c'est de la force brute, de l'analyse en // à haute vitesse. Deep blue est donné à 11,4 GFlop/s.
Et dans le texte précédent je lis : in other words, the most effective mixture of strategies that have been discovered - that run on a single desktop GPU.
Et par curiosité j'ouvre le site Nvidia, je vois l'encart sur la carte graphique la plus rapide jamais conçue (jusqu'à la prochaine hein :D) : 130 TFlops Tensor https://www.nvidia.com/fr-fr/titan/titan-rtx/
Je ne sais pas si Tensor du sens dans ce contexte , mais sinon 130 TFlops, c'est juste (130*1000)/11,4=11403 Deep Blue dans une carte graphique. C'est pas de la force brute les algos, mais il y a de quoi faire quand même.

Ca tourne vraiment sur un portable ? j'ai pas trouvé d'infos à ce sujet, sans trop chercher cela dit

Pour le machine learning ou même le deep learning ce qui consomme le plus, c'est la partie apprentissage ou là en effet Alphastar a consommé énormément de ressource mais une fois entraîné, ils font tourner leur model sur un simple PC :

Il en parle ici : 01h56min24s
https://youtu.be/cUTMhmVh1qs?t=6984
06/02/2019, 08h18
gallima

Citation:

Envoyé par Matthieu Vergne

Regarde la vidéo du match (pas le dernier article, celui d'avant). Les commentaires des gens de DeepMind m'ont laissé comprendre qu'il travaillaient encore activement dessus, ...

Nous n'interprétons pas la communication de DeepMind de la même manière; Pour moi le match final correspond juste à une autre variante plus équitable, pas à un match où le 'pro' serait revenu un peu plus tard pour tester une version ultérieur.
La communication de DeepMind, que ce soit dans la vidéo de présentation ou dans la presse c'est 'Mission accompli, nous avons gagné à StarCraft-ii'.
06/02/2019, 13h47
Uther

Citation:

Envoyé par gallima

1) Vision de toute la carte : C'est un avantage déterminant énorme.

Je suis même pas sur que ça changerait énormément de chose vu que l'API fournit toutes les informations instantanément, bouger la caméra ne coute qu'une action.

Citation:

Envoyé par gallima

2) Des piques à 1200action par minutes (APM) juste aux moments critiques, loin des 400 des humains. Et encore pour un humain à 400 y a beaucoup de spam, moins du tiers sont des actions qui changent l'état du jeu; là où Deepmind fait des déplacements simultané d'unitée.

En effet, et encore, le fait que AlphaStar ait commencé son apprentissage sur des parties d'humains fait qu'il spamme lui aussi pas mal d'ordres peu utiles. Probablement qu'avec des méthodes différentes ou plus d'apprentissage, il peut s'améliorer sur ce point.

Je pense qu'il n'y aura jamais de solution pleinement satisfaisante au problème des différences homme/machine sur les jeux temps réel, les humains n'étant de toute façon pas égaux entre eux non plus.

Citation:

Envoyé par gallima

Ce n'est pas le fait d'être à trois endroit en même temps qui pose un problème d'équité, c'est le fait de donner des ordres très précis de déplacement et de tir différentiés à chaque unités dans une grosse formation à 10 unités par secondes pendant les 3 secondes où se font le match. Cette micro-maitrise des déplacements et attaques permet à l'IA de s'orienter vers des unitées et style de jeu impraticable pour un humain. C'est pas équitable.

En théorie oui, dans la pratique, le style de jeu de AlphaStar restait quand même assez proche de ce qu'aurait pu faire un humain.

Citation:

Envoyé par gallima

3) Calcul au point de vie près de la survie des unitées pour les déplacements: Alphastar ne manipule pas la sourie, il accède directement aux unitées via son API, une grosse difficulté en moins; le clavier c'est moins génant mais dans l'absolu le problème est le même. C'est pas équitable.

En théorie oui, mais là aussi, ça n'est pas le cas car un réseau de neurones ne fait pas non plus du calcul parfaitement déterministe.

Citation:

Envoyé par gallima

4) Une seul carte pour jouer ? Sérieusement y en a plus de 200 dans le jeu. Même si l'humain sait quel carte va sortir, on sait très bien qu'il ne peut pas réduire sa cervelle pour qu'elle tourne plus vite sachant la carte. Un ordinateur peut le faire par contre. C'est pas juste.

Il n'y a pas tant de cartes que ça jouées professionnellement. En général chaque année Blizzard choisit 7 cartes pour le ladder (le classement continu) dont certaines sont des anciennes carte. De plus les joueurs ont généralement le droit de choisir 3 cartes sur lesquelles ils refusent de jouer. Il y a parfois des cartes différentes en tournoi, mais au final un joueur pro n'a pas a connaitre plus qu'une dizaine de carte.

Citation:

Envoyé par gallima

5) Que de match Protoss contre Protoss ? Pourquoi ne pas autoriser les Terran et Zerg ? La diversité fait partie de la complexité. Ca perd de l’intérêt, honnêtement j'ai zappé des morceaux à cause de ça. Au moins avec Alphago cela ressemblais au go.

Parce AlphaStar n'est tout simplement pas encore une IA complète pour Starcraft. DeepMind, n'a jamais prétendu que ces matchs étaient la preuve de la supériorité de la machine sur l'humain. Ce n'était qu'un point d'avancement qu'ils ont rendu public car ça donnait plein d'informations intéressantes pour le grand public sur leur approche actuelle du sujet.

Ils ont commencé au le plus simple (une seule carte et un seule race) pour adapter au fur et à mesure. Ce genre d'approche n'avait pas été nécessaire pour le jeu de Go car même s'il est complexe stratégiquement, les règles de base sont terriblement simples.

Citation:

Envoyé par gallima

6) Pas un seul rush/cheese dans les stratégies de Mana, 10 matches d'accords, mais 10 matches copiés/collés. Pourquoi ? Un 'pro' ne ferais jamais ça. Perso si la plan A ne marche pas je fais le plan B, et les 'pro' on plein de plans. Qui a payé qui ? Que dit le contrat ?

Mana n'est clairement pas un expert du cheese, il a voulu rester dans ce qu'il maitrise, y'a pas de complot a y voir. D'ailleurs d'après les dire de DeepMind, AlphaStar sait gérer les cheese vu que au début de l'apprentissage, elle s'était beaucoup concentré là dessus.

Citation:

Envoyé par gallima

7) Mana est un joueur pro, mais pas dans les 10 premiers. Dans le haut de la pyramide le niveau monte de plusieurs cran, 500 points de MRR entre Mana(n°19) et Serral(n° 1); pas de sélection en tournoi majeur en 2018 :

Ils ont juste présenté au public les résultats d'une d'expérience intermédiaire consistant à mesurer l'IA face à des humains de niveau professionnel après un apprentissage en circuit clos entre machines. Ils avaient fait la même chose pour AlphaGo.

Le but n'est pas encore de prouver la supériorité de la machine. Il ne s’agissait pas d'une confrontation en direct organisée comme pour Lee Sedol. Il feront sans doute cela lorsqu'il estimeront que AlphaStar est prêt.

Citation:

Envoyé par gallima

8) A l'origine Deepmind avait annoncé qu'ils allaient créer un système qui apprendrai tout le jeu par l'écran la sourie et le clavier...

Je ne sais pas ou tu as vu ça, je n'ai rien vu de tel. Au contraire, Blizzard a annoncé dès le début qu'il mettraient une API à la disposition de DeepMind pour piloter le jeu.

Citation:

Envoyé par gallima

L'abstraction requise pour comprendre le jeu n'a pas été maîtrisé, demain si le jeu évolue (comme il le fait souvent) Alphastar ne va pas s'adapter tout seul. Les capacité apprise par Alphastar ne sont vraisemblablement pas transposable à d'autre jeux de stratégies. Pour rappel, l'IA d'origine du jeu, même en 'élite' ne ralenti pas du tout le fonctionnement du jeu et fonctionne sur un Hierchical Task Network qui pourrait aussi être améliorer; mais l'éditeur doit vouloir permet aux joueurs occasionnel de gagner. Si demain Alphastar doit jouer à Dune2, il faudra ré-encoder le jeu dans Dune2star, un humain maîtriserai la différence en 2 ou 3 parties.

En effet, l'IA de AlphaStar est très spécifique à StarCraft. Une IA généraliste est beaucoup plus complexe, et DeepMind n'a jamais prétendu faire ça, du moins dans un premier temps. Après ce n'est pas fini. Peut-être que cela viendra plus tard, comme ils ont fait dans un second temps AlphaZero, une IA générique pour les jeux de plateaux qui a même battu AlphaGo.

Citation:

Envoyé par thelvin

Cela dit, on en arrive à ma première réaction devant la chose : c'est quoi l'intérêt de faire venir des pros, aussi accessibles soient-ils, et de publier les parties, pour affronter une version qui ne joue qu'une race, qu'une carte, et à l'API ?

Désolé mais, je trouve que ça reste quand même très intéressant de voir comment joue une IA. D’autant plus que DeepMind a donné plein d'informations relativement accessibles sur toutes les circonstances et les méthodes d'entrainement de l'IA.

Citation:

Envoyé par thelvin

Il y avait pas assez de master leagues auxquels demander un petit match amical discret, pour se faire une idée de ce que ça donne contre un humain pas trop manchot, non ?

Probablement. Mais bon, s'ils peuvent se permettre d'avoir accès à des vrai pros, pourquoi se priver. Ça fait toujours plus sérieux.

Citation:

Envoyé par thelvin

De fait, je vois mal ce que c'est d'autre que du buzz.

Forcément, comme toute les recherches de nos jours en fait. Si Alphabet investit des chercheurs a plein temps sur une IA qui ne va pas lui rapporter directement d'argent, c'est bien sûr parce que c'est une vitrine pour monter ces compétences.
06/02/2019, 15h22
gallima

@Uther Est ce que tu trouves que les avantages donnés à AlphaStar ne dérèglent pas le jeu; qu'ils sont fair-play; loin d'être ridicules et comparable à ce qui se passe entre deux humains ?
06/02/2019, 15h46
o_neill

Je suis totalement d'accord avec Gallima, combien d'entre vous ont vraiment regardé les matchs ? J'ai l'impression que pas beaucoup. Dans une des parties l'IA gagne en jouant des unités qui se font totalement contrer par celles du Pro. Elle est dans une situation où elle se fait contrer mais elle continue tout simplement car elle n'est pas intelligente, elle est plus performante.

Au final la compo de l'IA full stalker avec TP va battre celle de Mana en divisant en trois troupes qui attaque dans tous les sens et avec une micro-gestion a la milliseconde qui permet de prendre pil poil les dégâts permis puis de TP l'unité plus loin.

Et tous les commentateurs et le joueurs disent qu'aucun humain n'aurait pu gérer les unités comme ça et gagner avec cette compo. Sachant que sur presque toutes les games l'IA gagne en bonne partie grâce a cette micro gestion en combat.

Si on veux vraiment juger l'intelligence du programme il faut qu'il se batte a armes égales et qu'on puisse juger sur la stratégie et non sur la micro-gestion.

En résumé pour avoir un vrai match il faut :
- avoir la même vision de caméra qu'un humain.
- Définir des types d'actions, monitorer les moyennes et les pics que peuvent faire un humain (un pro) et dire ok un humain va monter a 120 APM sur la gestion d'unités en phase de combat mais du coup 30APM sur la gestion de l'économie. Et faire en sorte que l'IA ai un comportement possible pour un humain. Sinon autant la laisser monter a 15k APM ça revient au même c'est juste moin subtil.
- Les informations détenues par l'IA sont de la même manière trop précises. Elle va connaitre la vie et le shield de chacune de ses unités alors qu'un joueur n'a qu'une vue graphique moins précise à moins de cliquer spécifiquement sur l'unité puis de lire la valeur et de s'en souvenir. Il faudrait donc limiter la qualité des informations et la quantité de données que l'IA peux garder en mémoire.

Avec ces limitations techniques on aurait des combats qui seraient beaucoup plus équitables et qui joueraient donc sur la capacité a s'adapter, a trouver des solutions, des stratégies innovantes. Et pas juste a dire je peux tp mes unités tellement finement que tu n'en tueras jamais aucune.
06/02/2019, 18h39
Uther
Citation:

Envoyé par gallima

@Uther Est ce que tu trouves que les avantages donnés à AlphaStar ne dérèglent pas le jeu; qu'ils sont fair-play; loin d'être ridicules et comparable à ce qui se passe entre deux humains ?

Je vais donc préciser vu que j'ai visiblement été mal compris. Le duel n'était clairement pas équitable au niveau de ce que l'on attendrait d'une confrontation sportive officielle. Ce qui tombe bien vu que ça n'en était pas une, mais seulement un point d'étape sur l'avancement des progrès de AlphaStar. Je pense que tout le monde est conscient du problème. Pour preuve, la gestion de la caméra a été ajouté après les premiers matchs de Mana.

La question d'un véritable équilibre entre humain et IA lors d'une confrontation officielle est un problème complexe qui n'est probablement pas soluble de manière indiscutable. Il y a beaucoup de questions qui n'ont pas de réponses claires.
Les premières qui me viennent (liste non exhaustive) :
- quelles sont les limites réelles humaines ? (Ça va varier en fonction des personnes)
- dans les limites de la vitesse et de la précision des actions humaines, quelle est la part entre le cerveau et le physique ?
- si c'est une mesure d’intelligence, le fait que l'IA puisse prendre des décision plus vite doit il être pris en compte ?
- ...
Starcraft 2 n'étant pas un jeu de pure réflexion, AlphaStar n'aura probablement jamais le droit a une confrontation qui prouve de manière claire et incontestablement sa supériorité, comme AlphaGo.

Cela dit, ça reste quelque chose de très intéressant à observer même en sachant que les deux ne sont équivalents. La performance des ingénieurs de DeepMind est appréciable. Il faut voir que il y a beaucoup de différences entre un jeu de Go et Starcraft II (temps réel, informations partielles, ...). De ce que j'ai vu, la façon de jouer de l'IA sans être parfaite est quand même très logique.
06/02/2019, 22h15
gallima

Citation:

Envoyé par Uther

... Le duel n'était clairement pas équitable au niveau de ce que l'on attendrait d'une confrontation sportive officielle...

J'ai juste souligné le décalage abusé qui existe entre cette affirmation et le titre de la chronique de Stéphane le calme AlphaStar, la nouvelle IA de DeepMind qui a battu deux des meilleurs joueurs de Starcraft II, cf les arguments 1 à 8.
06/02/2019, 22h45
Matthieu Vergne

Citation:

Envoyé par gallima

Nous n'interprétons pas la communication de DeepMind de la même manière; Pour moi le match final correspond juste à une autre variante plus équitable, pas à un match où le 'pro' serait revenu un peu plus tard pour tester une version ultérieur.
La communication de DeepMind, que ce soit dans la vidéo de présentation ou dans la presse c'est 'Mission accompli, nous avons gagné à StarCraft-ii'.

Les titres et contenus putaclic de la presse, on a l'habitude. Par ailleurs, entre les titres à la "c'est gagné" et les contenus qui listent les points à améliorer pour pouvoir le comparer vraiment à l'humain, on peut vite voir que ça n'a pas convaincu tout le monde. Je préfère me focaliser sur les annonces des chercheurs, qui eux doivent faire attention à ce qu'ils affirment, car ils ne sont pas là que pour faire de la com'. Dans le discours de DeepMind, je n'ai jamais décelé la moindre impression de "ça y est, c'est terminé". Ils étaient surpris, ils étaient content, mais aucune impression de satisfaction style "tâche accomplie".

Ensuite, le match final n'est qu'un bonus. Ça n'a pas été fait en plusieurs matchs, critère nécessaire pour une évaluation scientifique un minimum sérieuse. Rien que par cette organisation, ce dernier match ne peut pas compter comme résultat de recherche. Pour autant, d'une part les gens de deepmind ont admis que la version sans caméra pouvait être considérée comme moins honnête (fair en anglais) et le fait qu'ils l'aient intégré montre qu'ils mettent encore des efforts dessus, d'autre part cette version a perdu alors qu'ils l'avaient évalué comme presqu'aussi compétente que l'autre, montrant que ces ajouts peuvent, potentiellement, changer la donne. Dire d'un côté que la méthode est améliorable, mais partir du principe que c'est gagné alors qu'une telle amélioration à montré un impact potentiel sur les résultats, en tant que chercheur ce serait très mal vu pour la simple raison que cela montre que les résultats ne sont pas validés de manière fiable. Ajoute à ces faits mon impression que DeepMind n'a jamais affiché un sentiment clair de terminé, et tu comprendras mon interprétation.

Mais comme une interprétation n'est que subjective, j'ai cherché de éléments concrets :
https://deepmind.com/blog/alphastar-...-starcraft-ii/

Ce post de DeepMind décrit AlphaStar et ses résultats récents contre les pros :

Citation:

MaNa defeated a prototype version of AlphaStar using the camera interface, that was trained for just 7 days. We hope to evaluate a fully trained instance of the camera interface in the near future.

Citation:

The game of StarCraft allows players to select one of three alien races: Terran, Zerg or Protoss. We elected for AlphaStar to specialise in playing a single race for now - Protoss - to reduce training time and variance when reporting results from our internal league.

De toute évidence, le projet n'est pas terminé. S'ils comptent continuer dessus, il ne fait aucun doute qu'ils devront publier dessus. Et pour être acceptés à la publication, ils comptent certainement montrer des améliorations. Par ailleurs, je n'ait aucun doute que d'un point de vue com', c'est bénéfique pour eux d'organiser des matchs, et donc ça ne m'étonnerait pas qu'ils profitent de nouvelles avancées pour organiser de nouveaux matchs, surtout vu les critiques présentées aux derniers. Je m'attends donc à de nouveaux matchs avec de nouvelles versions d'AlphaStar.

Et petit commentaire au passage :

Citation:

Envoyé par Uther

Une IA généraliste est beaucoup plus complexe, et DeepMind n'a jamais prétendu faire ça, du moins dans un premier temps.

Si, c'est leur but sur le long terme. AlphaGo/Zéro/Star ne sont que des étapes pour converger vers une IAG (intelligence artificielle générale).
https://www.theverge.com/2019/1/24/1...raft-2-victory

Citation:

DeepMind was clear about its goal in conducting this work. “First and foremost the mission at DeepMind is to build an artificial general intelligence,” said Oriol Vinyals, co-lead of the AlphaStar project, referring to the quest to build an AI agent that can perform any mental task a human being can. “To do so, it’s important to benchmark how our agents perform on a wide variety of tasks.”
03/03/2019, 11h20
orfraie

Pour Mathieu Vergne , bon éclairage de cette problématique.

Pour Mathieu Vergne , bon éclairage de cette problématique.

Voir 40 message(s) de cette discussion en une page