Apprentissage par renforcement - quel algorithme ?

**BioKore** · 02/02/2018, 20h58

Bonjour à tous !

Après avoir réussi (enfin) à obtenir de "bons" résultats (1.5% d'erreur) avec un réseau de neurones simple et un apprentissage classique (SGD Widrow-Horff) ou via mini-batch (mais là mon implémentation laisse à désirer : impossible de tomber en dessous des 10%), je m'intéresse donc à l'apprentissage par renforcement dans l'optique ambitieuse, à long terme, pourquoi pas, de faire apprendre le poker à un réseau.

Je me suis donc penché sur le premier algorithme trouvé sur internet pour ce type d'apprentissage : le Q-Learning, mais cette méthode me parait finalement assez peu adaptée à mon problème dans le sens où je peux avoir un nombre d'état gigantesque, sur plusieurs dimensions plongeant alors la phase de recueil des "rewards" sur plusieurs milliers voire millions de parties (heureusement, le nombre d'action est limité entre 5 et 10 selon le type de jeu).

A ce titre, j'aimerais savoir alors si quelqu'un pourrait m'orienter vers un algorithme moins contraignant.

Je rêve peut-être, mais ce qui pourrait être formidable, c'est de voir mon réseau s'améliorer de parties en parties.
Cependant, maintenant que j'y pense, j'imagine que ce dernier souhait m'orienterais plutôt vers de l'apprentissage non-supervisé pur...

Une idée ? des conseils ? N'hésitez pas !

Merci d'avance !

**BioKore** · 03/02/2018, 02h17

Petit aparté, je viens de trouver un article sur sputniknews qui "annule" mon idée pour le poker ; visiblement, je n'ai pas encore la puissance de calcul nécessaire /

Jouer au poker

Les développeurs de la société américaine DeepMind, propriété de Google, se sont engagés à apprendre à leur réseau de neurones artificiels à jouer au poker. Le poker est beaucoup plus difficile pour l'intelligence artificielle que le jeu de go, car l'ordinateur n'a pas suffisamment d'informations sur les événements du jeu. De plus, la psychologie est un élément essentiel du poker. Le fait que plus de deux personnes jouent habituellement au poker complique le calcul des probabilités. Néanmoins, dans un premier temps, le logiciel jouera au poker avec lui-même.

Mais bon, j'aimerais tout de même mieux comprendre le fonctionnement des apprentissages par renforcement dans la mesure du possible... Si quelqu'un a des algorithmes prometteurs à présenter, je serais ravi de les étudier !

Merci !

**Matthieu76** · 05/02/2018, 14h47

Envoyé par BioKore

Petit aparté, je viens de trouver un article sur sputniknews qui "annule" mon idée pour le poker

Je vois pas pourquoi cela "annulerait" ton idée; déjà ce n'est pas parce qu'ils disent que c'est difficile que tu ne peux pas réussir et en plus vous n'avez pas du tout les mêmes ambitions, eux veulent sûrement faire une IA capable de battre tous les meilleurs joueurs du monde alors que dans ton cas je pense que si tu obtiens une IA qui gagne une partie sur 2 contre des mecs random tu seras déjà très content.

Envoyé par BioKore

Cependant, maintenant que j'y pense, j'imagine que ce dernier souhait m'orienterais plutôt vers de l'apprentissage non-supervisé pur...

"ce dernier" ? Tu parles de qui/de quoi ?

Apprentissage par renforcement - quel algorithme ?

Intelligence artificielle

Discussions similaires

Partager

Partager