IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Pertinence du modèle apres une regression logistique


Sujet :

SAS STAT

  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2011
    Messages : 51
    Points : 44
    Points
    44
    Par défaut Pertinence du modèle apres une regression logistique
    Bonjour ,

    J'ai fait une regression logistique, j'obtiens un modele de 9 variables avec l'aire sous la courbe de roc (c)=0.812 sur echant d'apprentissage.

    Sous echant de validation, j'obtiens un modele 10 variables avec un c=0.837.
    (ie le modèle sur apprentissage +1 variables)

    Est il normal ? comment interpreter ce phenomene ?
    c'est normal que le c roc d'apprent > c roc de validation ?

    Merci

  2. #2
    Membre éclairé
    Homme Profil pro
    responsable adjoint service stat
    Inscrit en
    Mars 2009
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Activité : responsable adjoint service stat
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2009
    Messages : 448
    Points : 823
    Points
    823
    Par défaut
    Tu n'es pas supposé faire un nouveau modèle sur ta base de validation, sinon ce n'est plus une base de validation !

    Tu développe un modèle sur ta base de développement, et tu l'appliques à ta base de validation.
    Si ton modèle est robuste, les deux courbes de roc sont proches.
    Si ton modèle n'est pas robuste, celle de ta base de validation est bcp plus basse.

    Quand à ton phénomène, si ta base de validation est plus petite (c'est souvent le cas), tu risques d'avoir un phénomène de sur-apprentissage plus important, et un accuracy ratio apparemment plus élevé.

Discussions similaires

  1. Calcul d'un score après une regression logistique
    Par pistol22 dans le forum SAS STAT
    Réponses: 18
    Dernier message: 16/09/2015, 12h17
  2. Modèle optimal en regression logistique
    Par cococmoi dans le forum SAS STAT
    Réponses: 16
    Dernier message: 25/02/2014, 11h56
  3. Variables significatives dans une regression logistique
    Par cococmoi dans le forum SAS STAT
    Réponses: 0
    Dernier message: 26/04/2013, 15h22
  4. Réponses: 1
    Dernier message: 11/09/2011, 11h28
  5. Score sur une regression logistique
    Par Just07 dans le forum SAS STAT
    Réponses: 0
    Dernier message: 19/05/2011, 11h14

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo