Bonjour,

Je m'intéresse depuis quelques temps déjà aux perceptrons multicouches, et plusieurs questions me viennent à l'esprit.

  • L'algorithme de rétro-propagation du gradient permet de faire apprendre le perceptron en lui indiquant la sortie attendue en fonction de l'entrée présentée.
    Je me demande donc s'il est possible (avec le même algorithme ou éventuellement un autre) de générer l'apprentissage à partir de sortie qu'on refuse pour une entrée donnée.
    Prenons un exemple pour être plus clair :
    Imaginons que je crée un perceptron pour jouer au morpion. Comme exemple je souhaiterais lui présenter une grille vide à l'exception de la case centrale. Je ne sais pas moi même où il est le plus intéressant de jouer (c'est au perceptron de le découvrir), mais je sais en revanche qu'on ne peut pas se mettre au milieux (déjà occupé). Comment pourrais-je faire apprendre mon perceptron à partir de ce qu'il ne doit PAS faire dans une situation donnée, et non pas ce qu'il doit faire (puisque moi même je ne le sais pas...) ?
  • Je souhaite créer une intelligence artificielle pour un jeu de plateau (en fait un terrain de 100*100) sur lequel 3 joueurs jouent à tour de rôle, afin de construire et développer une ville. Il faut donc créer des routes ininterrompues, construire des infrastructures intelligemment (Un commerce de proximité fait augmenter la valeur des maisons, il faut donc le placer près de nos maison tandis qu'une déchetterie est évidement maléfique, il faut la placer près des maisons adverses). Est-ce qu'un perceptron est efficace/adapté pour ce type d'application ? Si oui comment l'utiliser ? Faut-il par exemple utiliser une manière alternative (algorithmique) pour déterminer les cases possibles pour la construction d'une route, et laisser le perceptron choisir entre les possibilités, ou tout lui laisser faire ?
  • Dans le cas d'une IA telle que celle évoquée précédemment, amenée à faire des choix, y a-t-il, dans le cas d'une défaite, un moyen de déterminer là où les erreurs ont été commises, et ainsi éviter de les refaire la prochaine fois ? Est-ce efficace, pour un perceptron multicouche, de considérer tous les choix comme mauvais en cas de défaite et de les inclure comme tels dans la base d'exemple à apprendre ?

Merci d'avoir pris le temps de me lire, j'espère que j'ai été clair. N'hésitez pas à demander des précisions...

A+