IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Interprétation sorties glm (binomial)


Sujet :

R

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    9
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 9
    Points : 9
    Points
    9
    Par défaut Interprétation sorties glm (binomial)
    Bonjour,

    je fais pour la première fois une régression logistique avec R (sur des pourcentages de mortalité de bestioles que j'étudie), et j'ai un problème quant à l'interprétation des sorties ...

    L'explication du jeu de données est assez simple : des espèces (species) dont les oeufs éclosent (hatched) ou n'éclosent pas (not_hatched) en fonction de l'humidité (rh).

    Les questions posées à partir de ces données sont simples également:

    - est-ce que l'humidité influence la mortalité ?
    - est-ce que les espèces influencent la mortalité (est-ce qu'il y a des différences de tolérance à l'humidité entre les espèces ?) ?
    - y a-t-il des interactions entre ces facteurs ?

    Sur les données ci-dessus, j'ai simplement codé deux glm, un prenant en compte les effets séparés des espèces et de l'humidité, avec la sortie associée,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    Call:
    glm(formula = Y ~ rh + species, family = binomial)
     
    Deviance Residuals: 
        Min       1Q   Median       3Q      Max  
    -3.5598  -1.3498  -0.1212   0.4648   2.7842  
     
    Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
    (Intercept) -16.12845    0.80498 -20.036  < 2e-16 ***
    rh            0.26277    0.01222  21.501  < 2e-16 ***
    speciesNI     3.10619    0.33508   9.270  < 2e-16 ***
    speciesPLA    4.88798    0.35582  13.737  < 2e-16 ***
    speciesPLC    3.20601    0.33542   9.558  < 2e-16 ***
    speciesPM    -1.07958    0.36348  -2.970  0.00298 ** 
    speciesPP    -2.29348    0.29515  -7.770 7.82e-15 ***
    speciesTA     4.93081    0.48496  10.167  < 2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
     
    (Dispersion parameter for binomial family taken to be 1)
     
        Null deviance: 2396.630  on 30  degrees of freedom
    Residual deviance:   74.329  on 23  degrees of freedom
    AIC: 159.9
     
    Number of Fisher Scoring iterations: 6
    et un deuxième avec prenant en compte également non seulement les facteurs séparément mais aussi leurs interactions éventuelles :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    Call:
    glm(formula = Y ~ species * rh, family = binomial)
     
    Deviance Residuals: 
         Min        1Q    Median        3Q       Max  
    -2.43370  -0.72174  -0.03878   0.00000   1.58765  
     
    Coefficients:
                    Estimate Std. Error z value Pr(>|z|)    
    (Intercept)   -2.507e+01  3.766e+00  -6.656 2.81e-11 ***
    speciesNI      1.618e+01  4.041e+00   4.004 6.23e-05 ***
    speciesPLA     1.558e+01  3.905e+00   3.990 6.61e-05 ***
    speciesPLC     1.564e+01  3.865e+00   4.045 5.23e-05 ***
    speciesPM     -1.715e+02  3.553e+04  -0.005 0.996149    
    speciesPP     -3.041e+00  5.415e+00  -0.562 0.574381    
    speciesTA      6.947e+00  6.479e+00   1.072 0.283641    
    rh             3.998e-01  5.570e-02   7.177 7.15e-13 ***
    speciesNI:rh  -2.194e-01  6.268e-02  -3.500 0.000466 ***
    speciesPLA:rh -1.765e-01  6.028e-02  -2.928 0.003416 ** 
    speciesPLC:rh -2.100e-01  5.851e-02  -3.589 0.000332 ***
    speciesPM:rh   2.462e+00  5.150e+02   0.005 0.996185    
    speciesPP:rh  -8.364e-04  7.815e-02  -0.011 0.991461    
    speciesTA:rh   2.310e-02  1.335e-01   0.173 0.862685    
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
     
    (Dispersion parameter for binomial family taken to be 1)
     
        Null deviance: 2396.630  on 30  degrees of freedom
    Residual deviance:   22.451  on 17  degrees of freedom
    AIC: 120.02
    Comme je vous l'ai dit c'est la première fois que je fais ça, et il y a certaines choses dans les sorties que je ne comprends pas ... d'où ces questions :

    1) Pourquoi l'espèce AS ne figure-t-elle pas dans les tables de coefficients ?
    2) Qu'est-ce que l'(intercept) et que signifie-t-il ?
    3) Pourquoi est-ce que je n'obtiens pas les mêmes significativités pour certaines espèces entre la première et la deuxième analyse, et laquelle serait la plus juste selon vous ? (j'opterais intuitivement pour la deuxième qui doit prendre en compte plus de paramètres et a une variance résiduelle plus proche des df)
    4) La deuxième analyse induit-elle que certaines espèces (PLA, NI, PLC) montrent des réponses réellement différentes de toutes les autres ?

    J'espère que vous aurez un peu de temps à consacrer à ces questions, et je vous en remercie beaucoup par avance !

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    73
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 73
    Points : 80
    Points
    80
    Par défaut
    Bonjour,
    Modélisation de ton premier modèle
    hatched= aplha+ beta*(species) + gamma*(rh) +epsilon
    Modélisation de ton deuxième modèle
    hatched= aplha+ beta*(species) + gamma*(rh) + theta*(species*rh) +epsilon

    Glm permet d'estimer les coefficients (aplha, beta,gamma,theta)

    1) la régression logistique a pris le species AS comme référence (odds ratio=1=exp(B=0)),tu raisonnes par rapport à ce coefficient pour interpréter les estimations ex: le specieNI a exp(3.10) de chance que les œufs éclosent que le species AS de référence, en tenant compte bien évidemment de l'humidité.
    2) intercept= l'estimation de ton alpha ( constante)
    3) tu n'as pas les mêmes significativités, car tu n'as pris en compte que les facteurs et pas l'interaction entre tes facteurs explicatifs dans le 1 modèle, ce qui prouve que l'interaction explique ta variable hatched c'est à dire le fait que les oeufs éclosent dépend de rh et au même temps de species, donc le modèle 2 est plus adéquat pour ta modélisation

    4)Oui, c'est la définition de l'interaction !!


    J'espère t'avoir aidé !

    Bien à toi
    Manoir

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    9
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 9
    Points : 9
    Points
    9
    Par défaut
    Bonjour Manoir

    Et merci beaucoup c'est beaucoup plus clair avec ces explications !

    J'ai une question de plus à propos du fait que le modèle prenne l'espèce AS comme référence : ce que je cherche à tester c'est si ces espèces diffèrent les unes par rapport aux autres dans leur réponse (hatched) à l'humidité (RH) ou non. Ici apparemment il ne le fait que par rapport à une seule espèce de référence ...

    Cela voudrait dire qu'il faut que je fasse tourner le même nombre d'analyse que j'ai d'espèces en lui faisant prendre une espèce de référence différente à chaque fois, ou y a-t-il une autre solution ?

    Merci encore !

    Skeum

  4. #4
    Membre régulier
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    73
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 73
    Points : 80
    Points
    80
    Par défaut
    Re,

    En prenant une seule référence, tu compares déjà les facteurs les unes par % aux autres d'après ta table:

    speciesNI 1.618e+01 4.041e+00 4.004 6.23e-05 ***
    speciesPLA 1.558e+01 3.905e+00 3.990 6.61e-05 ***

    specieNI a exp(1.618e+01 ) de chance que les œufs éclosent que le species AS de référence

    speciesPLA exp( 1.558e+01 ) de chance que les œufs éclosent que le species AS de référence

    donc specieNI a plus de chance que les œufs éclosent que le species speciesPLA

    tu peux toujours vérifier cela en prenant par exemple comme référence speciesPLA ou specieNI.

    Bon courage
    Manoir

  5. #5
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    9
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 9
    Points : 9
    Points
    9
    Par défaut
    Re-

    j'ai refait chaque analyse en prenant à tour de rôle chacune des espèces des espèces comme référence pour vérifier (j'aime bien vérifier ...) et ça y est j'ai assimilé tout ça !

    Et comme ce que j'observe sur les courbes se vérifie en chiffres, je ne peux dire qu'un grand grand merci pour la clarté et le rapidité de tes explications !

    A une prochaine (question)

    Skeum

  6. #6
    Nouveau Candidat au Club
    Homme Profil pro
    Inscrit en
    Août 2013
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations forums :
    Inscription : Août 2013
    Messages : 1
    Points : 1
    Points
    1
    Par défaut re : question sortie R
    Bonjour,

    Je relance la discussion (après 2 ans, je sais).

    Dans l'exemple, si Intercept correspond au paramètre alpha, où sont les autre paramètres? ( je ne comprend pas trop la sortie de R : j'ai l'impression qu'il y a un paramètre pour chaque modalité d'une variable)


    Merci d'avance pour vos réponses

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Interprétation sortie glm() R
    Par GuillaumeRoger dans le forum R
    Réponses: 3
    Dernier message: 23/04/2015, 03h05
  2. Réponses: 2
    Dernier message: 09/04/2013, 10h52
  3. GLM binomial logit
    Par marpanh dans le forum R
    Réponses: 4
    Dernier message: 18/05/2011, 00h02
  4. Interprétation sortie PROC MIXED
    Par Petru16 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 29/10/2010, 16h01
  5. Interprétations GLM binomial et poisson
    Par Fentahn dans le forum R
    Réponses: 3
    Dernier message: 18/10/2009, 21h59

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo