IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Apprentissage par renforcement - quel algorithme ?


Sujet :

Intelligence artificielle

  1. #1
    Membre actif Avatar de BioKore
    Homme Profil pro
    Dresseur d'Alpaga
    Inscrit en
    Septembre 2016
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Dresseur d'Alpaga

    Informations forums :
    Inscription : Septembre 2016
    Messages : 300
    Points : 219
    Points
    219
    Par défaut Apprentissage par renforcement - quel algorithme ?
    Bonjour à tous !

    Après avoir réussi (enfin) à obtenir de "bons" résultats (1.5% d'erreur) avec un réseau de neurones simple et un apprentissage classique (SGD Widrow-Horff) ou via mini-batch (mais là mon implémentation laisse à désirer : impossible de tomber en dessous des 10%), je m'intéresse donc à l'apprentissage par renforcement dans l'optique ambitieuse, à long terme, pourquoi pas, de faire apprendre le poker à un réseau.

    Je me suis donc penché sur le premier algorithme trouvé sur internet pour ce type d'apprentissage : le Q-Learning, mais cette méthode me parait finalement assez peu adaptée à mon problème dans le sens où je peux avoir un nombre d'état gigantesque, sur plusieurs dimensions plongeant alors la phase de recueil des "rewards" sur plusieurs milliers voire millions de parties (heureusement, le nombre d'action est limité entre 5 et 10 selon le type de jeu).

    A ce titre, j'aimerais savoir alors si quelqu'un pourrait m'orienter vers un algorithme moins contraignant.

    Je rêve peut-être, mais ce qui pourrait être formidable, c'est de voir mon réseau s'améliorer de parties en parties.
    Cependant, maintenant que j'y pense, j'imagine que ce dernier souhait m'orienterais plutôt vers de l'apprentissage non-supervisé pur...

    Une idée ? des conseils ? N'hésitez pas !

    Merci d'avance !

  2. #2
    Membre actif Avatar de BioKore
    Homme Profil pro
    Dresseur d'Alpaga
    Inscrit en
    Septembre 2016
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Dresseur d'Alpaga

    Informations forums :
    Inscription : Septembre 2016
    Messages : 300
    Points : 219
    Points
    219
    Par défaut
    Petit aparté, je viens de trouver un article sur sputniknews qui "annule" mon idée pour le poker ; visiblement, je n'ai pas encore la puissance de calcul nécessaire /


    Jouer au poker

    Les développeurs de la société américaine DeepMind, propriété de Google, se sont engagés à apprendre à leur réseau de neurones artificiels à jouer au poker. Le poker est beaucoup plus difficile pour l'intelligence artificielle que le jeu de go, car l'ordinateur n'a pas suffisamment d'informations sur les événements du jeu. De plus, la psychologie est un élément essentiel du poker. Le fait que plus de deux personnes jouent habituellement au poker complique le calcul des probabilités. Néanmoins, dans un premier temps, le logiciel jouera au poker avec lui-même.

    Mais bon, j'aimerais tout de même mieux comprendre le fonctionnement des apprentissages par renforcement dans la mesure du possible... Si quelqu'un a des algorithmes prometteurs à présenter, je serais ravi de les étudier !

    Merci !

  3. #3
    Membre éclairé Avatar de Matthieu76
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Mars 2013
    Messages
    568
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2013
    Messages : 568
    Points : 890
    Points
    890
    Par défaut
    Citation Envoyé par BioKore Voir le message
    Petit aparté, je viens de trouver un article sur sputniknews qui "annule" mon idée pour le poker
    Je vois pas pourquoi cela "annulerait" ton idée; déjà ce n'est pas parce qu'ils disent que c'est difficile que tu ne peux pas réussir et en plus vous n'avez pas du tout les mêmes ambitions, eux veulent sûrement faire une IA capable de battre tous les meilleurs joueurs du monde alors que dans ton cas je pense que si tu obtiens une IA qui gagne une partie sur 2 contre des mecs random tu seras déjà très content.


    Citation Envoyé par BioKore Voir le message
    Cependant, maintenant que j'y pense, j'imagine que ce dernier souhait m'orienterais plutôt vers de l'apprentissage non-supervisé pur...
    "ce dernier" ? Tu parles de qui/de quoi ?

Discussions similaires

  1. [IA] Implémentation d'un apprentissage par renforcement
    Par shinigami dans le forum Méthodes prédictives
    Réponses: 9
    Dernier message: 16/07/2019, 22h25
  2. Apprentissage par renforcement et reconnaissance
    Par SKone dans le forum Méthodes prédictives
    Réponses: 6
    Dernier message: 18/01/2011, 11h30
  3. [java] Apprentissage par renforcement et Tic-Tac-Toe
    Par Champialex dans le forum Contribuez
    Réponses: 0
    Dernier message: 16/06/2010, 01h30
  4. [Algo] Apprentissage par renforcement
    Par adretto dans le forum Méthodes prédictives
    Réponses: 1
    Dernier message: 24/05/2007, 19h25
  5. Apprentissage par Renforcement
    Par Le Furet dans le forum Méthodes prédictives
    Réponses: 4
    Dernier message: 11/08/2005, 17h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo