IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Interprétation sortie glm() R


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2015
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2015
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Interprétation sortie glm() R
    Bonjour à tous,

    Dans le cadre d'un projet sous R, je dois choisir, en prenant la même fonction lien logarithmique, entre deux modèles (qui diffèrent par la loi choisie), celui présentant le meilleur résultat en me basant seulement sur les résultats des tests de AIC et de Deviance.
    D'après ce que j'ai cru comprendre, l'AIC doit être minimisée et la Deviance aussi (le critère pour dire qu'elle est assez faible étant d'avoir 1 – pchisq(Null deviance , Df Null) > 5% et 1 – pschisq(Residual deviance, Df Residual) > 5%).
    Du coup, est-ce que le modèle choisi doit être celui répondant aux deux conditions précédentes et ayant l'AIC le plus faible ?

    Ensuite, je dois retirer de mon modèle les variables explicatives les moins significatives, pouvez-vous me confirmer que ce sont celles dont la valeur absolue du coefficient est proche de 1 ?

    Je viens de débuter (seul) en modèles linéaires généralisés et n'ai pas réussi à trouver la réponse à ces questions sur les forums.

    Si vous pouviez m'aider là-dessus, ça m'arrangerait vraiment.

    Guillaume

  2. #2
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    Août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2013
    Messages : 139
    Points : 316
    Points
    316
    Par défaut
    Bonjour,

    De nombreux topics sur le forum traitent déjà de l'utilisation des modèles linéaires avec R.
    Par exemple :
    http://www.developpez.net/forums/d15...s/r/sortie-lm/
    ou encore :
    http://www.developpez.net/forums/d15...-anova-glm-lm/
    et enfin :
    http://www.developpez.net/forums/d14...nnees-vitales/

    Je pense que tu pourras trouver une partie de tes réponses là.

    Sinon je te conseille fortement cette petite présentation qui te permettra de mener une étude utilisant les modèles linéaires généralisés :
    http://rug.mnhn.fr/semin-r/PDF/semin...ros_110308.pdf


    Bon courage

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2015
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2015
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup pour ta réponse chautho.

    J'ai un peu avancé et aurais maintenant un nouveau problème : pour chacune de mes variables explicatives (ce sont des qualitatives que j'ai transformées avec la fonction factor()), la première modalité n'apparaît pas après exécution du summary(glm) alors qu'elle est bien présente lorsque je fais un simple summary sur chacune des variables.

    Par ailleurs, si le code :
    summary(glm(freq_moyenne ~ F_veh_body + F_veh_age + F_gender + F_area + F_agecat,family = poisson(link = "log"),weights = exposure)) fonctionne bien (en dehors du problème précédent), ce n'est pas le cas de :
    summary(glm(freq_moyenne ~ F_veh_body + F_veh_age + F_gender + F_area + F_agecat,family = binomial(link = "log"),weights = exposure)) qui me donne :
    Error in eval(expr, envir, enclos) : y values must be 0 <= y <= 1.

    J'ai cherché et je n'arrive pas à comprendre pourquoi. Si quelqu'un avait une réponse là-dessus, ça serait vraiment super.

  4. #4
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2012
    Messages
    345
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : France, Seine Maritime (Haute Normandie)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2012
    Messages : 345
    Points : 249
    Points
    249
    Par défaut
    Citation Envoyé par GuillaumeRoger Voir le message
    Merci beaucoup pour ta réponse chautho.

    J'ai un peu avancé et aurais maintenant un nouveau problème : pour chacune de mes variables explicatives (ce sont des qualitatives que j'ai transformées avec la fonction factor()), la première modalité n'apparaît pas après exécution du summary(glm) alors qu'elle est bien présente lorsque je fais un simple summary sur chacune des variables.

    Par ailleurs, si le code :
    summary(glm(freq_moyenne ~ F_veh_body + F_veh_age + F_gender + F_area + F_agecat,family = poisson(link = "log"),weights = exposure)) fonctionne bien (en dehors du problème précédent), ce n'est pas le cas de :
    summary(glm(freq_moyenne ~ F_veh_body + F_veh_age + F_gender + F_area + F_agecat,family = binomial(link = "log"),weights = exposure)) qui me donne :
    Error in eval(expr, envir, enclos) : y values must be 0 <= y <= 1.

    J'ai cherché et je n'arrive pas à comprendre pourquoi. Si quelqu'un avait une réponse là-dessus, ça serait vraiment super.

    Bonjour,

    Je ne sais pas quelles sont les données présentes dans la variable freq_moyenne mais je pense vous ne pouvez pas faire une deux régressions glm binomiales et poissons sur un même jeu de données, pour la binomiale, votre variable freq_moyenne ne doit contenir que des 0 ou des 1.

    Cordialement
    Lorsque vous avez obtenu une réponse satisfaisante à votre discussion, N'oubliez pas de cliquer sur

    L'erreur n'annule pas la valeur de l'effort accompli.

Discussions similaires

  1. Interpétation d'une sortie glm
    Par celine333 dans le forum R
    Réponses: 1
    Dernier message: 05/11/2014, 10h01
  2. Interprétation sorties glm (binomial)
    Par skeum dans le forum R
    Réponses: 5
    Dernier message: 21/08/2013, 20h47
  3. Réponses: 2
    Dernier message: 09/04/2013, 10h52
  4. problème pour interpréter une sortie de GLM
    Par mickael.legall1 dans le forum R
    Réponses: 3
    Dernier message: 23/02/2011, 10h28
  5. Interprétation sortie PROC MIXED
    Par Petru16 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 29/10/2010, 16h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo