AlphaGo apprend des stratégies et décide ses coups de lui-même mais il n'y a pas de magie la dedans : son fonctionnement suit un programme bien précis (deep learning + monte-carlo arborescent). Son type de jeu dépend de ses données d'apprentissage et des stratégies découvertes lors de l'exécution du programme.
Certains algo d'AlphaGo sont probabilistes donc il est possible qu'il joue une partie différente (d'autant plus que la phase de deep learning est également régulièrement "alimentée"). Ceci dit, s'il avait déjà trouvé une super stratégie, il est tout à fait possible qu'il rejoue la même.
Je ne connais pas bien le Go mais j'imagine que les joueurs ont des stratégies différentes. Concernant AlphaGo, la partie deep learning apprend à partir de données "humaines" donc il est possible que ça pousse l'IA a jouer "comme un humain" mais la partie monte-carlo qui vient ensuite peut changer complètement le comportement. En fait, l'IA s'oriente naturellement vers une stratégie qui lui semble efficace et si c'est vraiment la stratégie la plus efficace, il y a des chances pour que ce soit également "celle des humains". Il est également possible qu'elle ait trouvé une meilleure stratégie que tout le monde jusque là et dans ce cas Lee Sedol va se faire démonter...
Partager