IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Amélioration d'un modèle d'apprentissage


Sujet :

Méthodes prédictives

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Responsable d'un système d'information métier
    Inscrit en
    Mars 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Responsable d'un système d'information métier

    Informations forums :
    Inscription : Mars 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut Amélioration d'un modèle d'apprentissage
    Bonjour,

    A partir d'une base d'apprentissage, j'ai défini un modèle basé sur une régression logistique qui permet de prédire une réponse/non réponse.
    Ce modèle va être utilisé en pratique au travers d'un logiciel. Si le logiciel prédit une réponse positive, on lance le test en pratique. Le résultat réel du test est enregistré, permettant de savoir si la prédiction du modèle était bonne ou mauvaise.

    Je souhaiterai améliorer le modèle initial en intégrant l'information fournie par ces nouvelles données.
    L'utilisation du modèle pour faire un "pré-tri" introduit un biais qui ne me permet pas de construire simplement un nouveau modèle de régression logistique sur l'ensemble des données.

    Je cherche donc des méthodes d'amélioration d'algorithme. Je ne parviens pas à trouver le nom de méthode s'apparentant à cela.
    Est- ce que cela parle à quelqu'un?

    Merci

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    j'essaie de te répondre le mieux possible sans être sur d'être très juste.

    Cela pour te dire qu'on ne peut pas améliorer un modèle de régression logistique ou autre en dehors de quelque cas spécifique sans refaire un modèle.

    Attention, la constitution d'un Dataset doit avoir une taille critique difficile à définir. Ajouter des données supplémentaires n'améliora pas toujours le modèle. L'amélioration d'un modèle se fera uniquement dans ce cas par une diversification des données en entrée.

    Au plaisir de te lire.

  3. #3
    Nouveau Candidat au Club
    Femme Profil pro
    Responsable d'un système d'information métier
    Inscrit en
    Mars 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Responsable d'un système d'information métier

    Informations forums :
    Inscription : Mars 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup pour ta réponse.
    Mon jeu de données de départ est assez restreint, c'est pourquoi je pense que le modèle pourra être amélioré.

    Tu parles de refaire un modèle, ce serait possible malgré le biais de sélection de mon modèle actuel?

    Et si je pars sur une autre méthode d'apprentissage que la régression logistique, sais-tu si d'autres méthodes me permettraient d'améliorer le modèle à posteriori?

  4. #4
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Tu parles de refaire un modèle, ce serait possible malgré le biais de sélection de mon modèle actuel?
    Je ne comprends pas bien cet aspect(le biais) de ta question, peux-tu préciser ?

    sais-tu si d'autres méthodes me permettraient d'améliorer le modèle a posteriori?
    À part dans certains Tutorial de Tensorflow ou l'apprentissage se fait par vague successive, je ne sais pas. Ça reste une solution complexe à mettre en oeuvre.

  5. #5
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 053
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 053
    Points : 9 392
    Points
    9 392
    Par défaut
    Les nouveaux 'individus' testés sont tous des individus qui ressortaient comme positifs selon le premier modèle, et à l'arrivée, ces individus vont s'avérer positifs, ou bien négatifs.
    Le nouveau modèle bâti sur plus d'individus sera donc forcément plus 'pessimiste' que l'ancien modèle.

    Idéalement, il faudrait lancer aussi une mesure sur certains individus estimés comme négatifs (les plus proches de la frontière pour des raisons de coûts), pour éliminer, ou au moins réduire ce biais.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  6. #6
    Nouveau Candidat au Club
    Femme Profil pro
    Responsable d'un système d'information métier
    Inscrit en
    Mars 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Responsable d'un système d'information métier

    Informations forums :
    Inscription : Mars 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    Citation Envoyé par dev_ggy Voir le message
    Je ne comprends pas bien cet aspect(le biais) de ta question, peux-tu préciser ?
    Je fais une sélection par mon modèle, et ne fais le test que si le modèle prédit une réponse. Mes nouvelles données vont donc toute avoir un profil de base similaire.

    Un exemple simplifié : si mon modèle de départ dit "les hommes répondent, les femmes non"
    Si un homme arrive, mon modèle dit "répondeur" donc je fais le test en réel, et j'observe la réponse réelle.
    Si une femme arrive, mon modèle dit "non répondeur" donc je ne fais pas le test en réel. Et je n'ai donc pas l'info.

    A terme, sur les données que j'ai collecté, j'aurai donc que des hommes.
    C'est ce que j'entends par biais.
    Je n'arrive pas à déterminer si ça va avoir un impact ou non.

    Merci, je vais aller regarder ce qu'est Tensorflow.

  7. #7
    Nouveau Candidat au Club
    Femme Profil pro
    Responsable d'un système d'information métier
    Inscrit en
    Mars 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Responsable d'un système d'information métier

    Informations forums :
    Inscription : Mars 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    Citation Envoyé par tbc92 Voir le message
    Les nouveaux 'individus' testés sont tous des individus qui ressortaient comme positifs selon le premier modèle, et à l'arrivée, ces individus vont s'avérer positifs, ou bien négatifs.
    Le nouveau modèle bâti sur plus d'individus sera donc forcément plus 'pessimiste' que l'ancien modèle.

    Idéalement, il faudrait lancer aussi une mesure sur certains individus estimés comme négatifs (les plus proches de la frontière pour des raisons de coûts), pour éliminer, ou au moins réduire ce biais.
    Merci tbc92, c'est exactement ça le biais que j'évoquais.
    Pourquoi le nouveau modèle serait plus pessimiste, sachant qu'il y aura au final surement plus de répondeur dans ma base de données que sur la population générale?

    ça te semble pertinent de construire à nouveau un modèle de régression logistique sur le pool individu de départ + individu testés? Au delà d'un modèle + pessimiste, il n'y a pas d'autre problématique?

    Je suis d'accord avec ta proposition pour l'ajout d'individus estimés comme négatifs, mais dans la pratique je en suis pas sûre que je puisse le mettre en place.

  8. #8
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 053
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 053
    Points : 9 392
    Points
    9 392
    Par défaut
    Normalement, le modèle devrait devenir plus pessimiste ; on va se placer dans un cadre médical pour illustrer : le modèle initial considérait que sur les individus hommes de plus de 40 ans, la technique donnerait un résultat positif... On fait donc la 'mise en production' sur ce périmètre, et il s'avère que ça marche sur les hommes de plus de 40 ans et de plus de 80 kg uniquement. Le nouveau modèle sera donc plus pessimiste (même si effectivement, il a une proportion de positifs plus élevée que l'échantillon d'origine).
    Il y a peut être un risque que le nouveau modèle estime que le traitement marchera pour les hommes de plus de 35 ans et de plus de 80kg, donc effectivement ni plus pessimiste, ni moins pessimiste.
    Mais vu de loin, j'ai tendance à dire qu'avec un bon algorithme, ça ne devrait pas arriver. Ce n'est que mon point de vue, qui n'engage que moi, et donc qui n'a aucune vraie valeur.

    Dans un milieu où chaque mesure a un coût, j'imaginais bien que tu n'obtiendrais pas de mesure sur les individus estimés comme négatifs.
    J'imagine qu'il y a un seuil, une note limite : aujourd'hui tu classes comme positifs les individus qui ont une note supérieure à 0.75 par exemple. A toi de tricher un peu, en abaissant ce seuil à 0.72.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  9. #9
    Nouveau Candidat au Club
    Femme Profil pro
    Responsable d'un système d'information métier
    Inscrit en
    Mars 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Responsable d'un système d'information métier

    Informations forums :
    Inscription : Mars 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    Merci tbc92 pour ta réflexion sur ma problématique. Je comprends mieux pourquoi tu parlais d'un modèle plus pessimiste.

    Il y a en effet un seuil, et l'abaisser peut effectivement me permettre d'élargir un peu le nombre d'individus testés. Merci pour cette piste!

Discussions similaires

  1. Les étapes d'apprentissage d'un modèle acoustique en RAP
    Par Sahar_Rose dans le forum Algorithmes et structures de données
    Réponses: 0
    Dernier message: 19/02/2014, 10h22
  2. Modèle de données standard, ou améliorable ?
    Par AntoineGael dans le forum Langage SQL
    Réponses: 2
    Dernier message: 21/04/2010, 15h20
  3. apprentissage non supervisé .......
    Par ratbert dans le forum Statistiques, Data Mining et Data Science
    Réponses: 7
    Dernier message: 22/02/2008, 12h23
  4. A propos des modèles d'objet (avec sources)
    Par DevX dans le forum C++Builder
    Réponses: 14
    Dernier message: 01/12/2002, 12h22
  5. apprentissage du C est-il necessaire pour C++ ?
    Par Anonymous dans le forum C
    Réponses: 6
    Dernier message: 02/05/2002, 12h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo