Bonjour à tous,
Depuis peu je m'intéresse à l'IA et plus particulièrement aux réseaux de neurones.
J'ai compris le principe de fonctionnement des réseaux PMC et grossièrement celui des réseaux de kohonen et Hopfield, mais certaines choses m'échappent sur leur utilisation.
Situation :
Imaginons que je veuilles faire une IA pour un jeu de puissance 4 en utilisant un réseau de neurone (oui c'est pas forcément la meilleure des solutions, un algorithme min-max aurait très bien fait l'affaire, mais c'est pour l'exemple).
J'imagine que le réseau prendrait en entrée les 42 cases du plateau qui seraient des entiers (1 (sa couleur) / 0(vide) / -1(la couleur de l'adversaire))
Le reseau donnerait un sortie un chiffre dans [0, 1[ , qu'on multiplierait par 7 pour connaître l'emplacement du pion à poser.
(à ce point là, la modélisation est viable ou totalement incorrecte ?)
La principale question que je me posais est :
Comment faire apprendre au réseau si le coup qu'il vient de faire est bon (et comment le savoir d'ailleurs? c'est le réseau qui s'occupe de ça) ?
Car on ne pourra savoir qu'à la fin de la partie si on a gagné ou perdu, et on ne connaîtra pas l'influence de ce coup dans la victoire.
Et sinon, quel serait le type de réseau adapté pour une telle IA ? (ou une IA de jeu vidéo j'imagine, ce serait le même principe en plus complexe)
Merci !
Partager