IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

[Algo] Apprentissage par renforcement


Sujet :

Méthodes prédictives

  1. #1
    Nouveau Candidat au Club
    Inscrit en
    Mai 2007
    Messages
    1
    Détails du profil
    Informations forums :
    Inscription : Mai 2007
    Messages : 1
    Points : 1
    Points
    1
    Par défaut [Algo] Apprentissage par renforcement
    Bonjour
    j'essaie de trouver un algorithme qui me permettrait de résoudre mon problème :
    J'ai un tableau de 20*8 contenant des valeurs allant de 1 à 100.
    le tableau est par exemple initialisé qu'avec des 1.
    Lorsque je transmet ce tableau à une fonction de calcul noté f(tab) j'ai en retour un nombre entre 1 et 1000.

    Je cherche un algo me permettant de modifié dynamiquement les valeurs de mon tableau pour obtenir le plus grand nombre en sortie de f(tab).
    Si je test toutes les possibilités cela me donne 100puissance160 ce qui est évidemment pas la meilleur des solutions ni la plus rapide.

    En cherchant j'ai vu que les algo d'apprentissage par renforcement seraient la solutions mais je vois pas comment les implémenter à mon problème.

    Est ce que qqn a une idée lumineuse ???
    Merci

  2. #2
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 081
    Points
    16 081
    Par défaut
    Sans en savoir plus sur la fonction f(tab), il n'y a pas d'autre methode que de tester toutes les configurations possibles.

    ==> il faut découvrir les propriétés de la fonction f(tab).

    Soit tu as accès au code de cette fonction et tu peux regarder ses propriétés.

    Soit tu n'as pas accès au code de cette fonction, et il va falloir faire des suppositions (linéaire, correlation), tester ces suppositions et en déduire des propriétés. Mais il n'y a aucune garantie que tu trouves le vrai argmax.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

Discussions similaires

  1. [IA] Implémentation d'un apprentissage par renforcement
    Par shinigami dans le forum Méthodes prédictives
    Réponses: 9
    Dernier message: 16/07/2019, 22h25
  2. Création d'un reseau récurrent avec apprentissage par renforcement
    Par raphchar dans le forum Méthodes prédictives
    Réponses: 2
    Dernier message: 19/07/2012, 15h35
  3. Apprentissage par renforcement et reconnaissance
    Par SKone dans le forum Méthodes prédictives
    Réponses: 6
    Dernier message: 18/01/2011, 11h30
  4. [java] Apprentissage par renforcement et Tic-Tac-Toe
    Par Champialex dans le forum Contribuez
    Réponses: 0
    Dernier message: 16/06/2010, 01h30
  5. Apprentissage par Renforcement
    Par Le Furet dans le forum Méthodes prédictives
    Réponses: 4
    Dernier message: 11/08/2005, 17h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo