IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Régression logistique et GLM normale : résultats différents !


Sujet :

Méthodes prédictives

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut Régression logistique et GLM normale : résultats différents !
    Bonjour à tous,
    j'ai un ensemble de 50 variables 1 variable qualitative y (0 cellule normale /1 cellule anormale) et 49 variables quantitatives
    alors
    j'ai fait la commande suivante
    puis j'ai passé à la sélection stepwise
    et en appliquant le test de wald j'ai trouvé des variables significatives
    après quand j'ai cherché sur internet il est mentionné que cette commande signifie que le paramètre family=gaussian
    donc pour faire une régression logistique j'ai fait le suivant
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    glm(y~.,data=donnees,family=binomial)
    puis j'ai passé au stepwise et cette fois-ci et en passant au test de wald toutes les variables étaient non significatives !( sachant que avant la sélection toutes les variables étaient significatives)
    que dois je faire ?

    d'une part ,je ne comprends pas la différence entre les 2 résultat et surtout pourquoi les variables pour la régression logistiques sont non significatives ?
    merci infiniment d'avance pour toute réponse

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Deux modèles différents peuvent donner des résultats différents. C'est liée aux données. Pour trouver l'explication, il faudrait regarder entre autre comment la variable y est corrélée de façon linéaire avec les paramètres.

    Pour savoir quoi faire concernant le choix des familles de loi sous-jacentes, je pourrais vous conseiller de choisir une loi qui est proche de la répartition de vos données.

    Par exemple :
    Dans le cas d'un CA on pourrait prendre log normal.
    Dans le cas de déplacement, une gaussienne serait très bien.
    Pour des quantité, poisson ou quasi poisson.

    Maintenant dans le choix du modèle il faut prendre le plus pertinent, qui correspond à l'erreur la plus petite (vous pouvez vérifier le surapprentissage).


    Au plaisir de vous lire,

  3. #3
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 219
    Points
    16 219
    Par défaut
    Dans to premier modèle, peut être que la fonction glm considère que ta variable est continue et non binaire, ce qui fait que les méthodes de définition et/ou d'estimation des paramètres sont peut être différentes.
    Les balises code
    FAQ SAS
    Rubrique SAS

    Si vous souhaitez contribuer à la rubrique SAS, contactez-moi ou tout autre membre de l'équipe BI par MP.

Discussions similaires

  1. Réponses: 4
    Dernier message: 02/07/2013, 11h39
  2. Réponses: 2
    Dernier message: 09/04/2013, 10h52
  3. Tous les résultats d'une régression logistique
    Par nanou2183 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 13/08/2012, 16h19
  4. Régression logistique - interprétation des résultats
    Par cococmoi dans le forum SAS STAT
    Réponses: 0
    Dernier message: 19/07/2012, 16h50
  5. npar1way vs GLM :résultats différents
    Par jlp65 dans le forum SAS STAT
    Réponses: 8
    Dernier message: 22/09/2011, 11h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo