IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Regression logistique pour mémoire de recherche en psychologie sociale


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Retraitée
    Inscrit en
    Juin 2014
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Maroc

    Informations professionnelles :
    Activité : Retraitée

    Informations forums :
    Inscription : Juin 2014
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Regression logistique pour mémoire de recherche en psychologie sociale
    Bonjour,
    Je suis actuellement en master 1 de psychologie sociale et je fais un mémoire de recherche.
    J'ai fait des statistiques pendant les 3 années de licence plus l'année de master, mais je n'ai pas eu l'occasion d'utiliser la régression logistique.
    J'ai une petite connaissance du logiciel R et j'ai suivi dernièrement un MOOC qui y était consacré.
    Je suis aujourd'hui confrontée à l'analyse de mes données et je ne voudrais pas partir sur de mauvaises bases.
    Ma variable à expliquer est binaire (coupable = 0/non coupable = 1). Mes variables explicatives sont au nombre de deux : Test ADN négatif = 1/pas de test ADN = 0, ainsi que Présence d'un expert = 1, pas de présence d'un expert = 0.

    J'ai utilisé la fonction "glm" sous R et j'ai obtenu les résultats suivants :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    glm(formula = Culpabilite ~ ADN + Expert, family = binomial(logit), 
        data = essais3)
     
    Deviance Residuals: 
        Min       1Q   Median       3Q      Max  
    -1.2848  -0.5452  -0.4294  -0.1549   2.2043  
     
    Coefficients:
                Estimate Std. Error z value Pr(>|z|)    
    (Intercept)  -4.4176     0.9814  -4.501 6.75e-06 ***
    ADN           2.0803     0.7433   2.799  0.00513 ** 
    Expert        2.5863     0.8375   3.088  0.00202 ** 
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
     
    (Dispersion parameter for binomial family taken to be 1)
     
        Null deviance: 80.064  on 79  degrees of freedom
    Residual deviance: 57.986  on 77  degrees of freedom
    AIC: 63.986
     
    Number of Fisher Scoring iterations: 6
     
     
    Rcmdr>  GLM.2 <- glm(Culpabilite ~ ADN*Expert, family=binomial(logit), data=essais3)
     
    Rcmdr>  summary(GLM.2)
     
    Call:
    glm(formula = Culpabilite ~ ADN * Expert, family = binomial(logit), 
        data = essais3)
     
    Deviance Residuals: 
         Min        1Q    Median        3Q       Max  
    -1.26373  -0.57012  -0.45904  -0.00008   2.14597  
     
    Coefficients:
                Estimate Std. Error z value Pr(>|z|)
    (Intercept)   -19.57    2404.67  -0.008    0.994
    ADN            17.37    2404.67   0.007    0.994
    Expert         17.83    2404.67   0.007    0.994
    ADN:Expert    -15.43    2404.67  -0.006    0.995
     
    (Dispersion parameter for binomial family taken to be 1)
     
        Null deviance: 80.064  on 79  degrees of freedom
    Residual deviance: 57.437  on 76  degrees of freedom
    AIC: 65.437
     
    Number of Fisher Scoring iterations: 18
     
    > exp(coefficients(mod1))
    (Intercept)         ADN      Expert 
     0.01206335  8.00672440 13.27997835
    Ci-dessous l'interprétation que je fais de ces résultats.
    En ce qui concerne la première régression : le p est inférieur à 0.05 ce qui signifie que les deux variables (ADN et EXPERT) sont associées à un verdict "non coupable". Les coefficients "estimate" sont respectivement 2.0803 et 2.5863 ; ils sont positifs ce qui confirme qu'un test ADN négatif est statistiquement associé à un verdict "Non coupable" et que la présence d'un expert est statistiquement associé à un verdict "Non coupable".
    Enfin, le calcul de l'exponentiel des coefficients montre que la présence d'un test ADN négatif multiplie par 8 (8.0067) la possibilité d'un verdict "non coupable" et la présence d'un expert multiplie cette possibilité par 13 (13,2799).

    Par contre si on regarde la 2ème régression logistique où il y a une possible interaction entre ADN et expert, on constate que le p est supérieur à 0.05, on ne peut donc pas déduire qu'il y a une synergie entre ADN et EXPERT.

    Si quelqu'un parmi vous pouvait me dire si le choix de la régression logistique est le bon choix et si mon interprétation des résultats semble acceptable pour la rédaction d'un mémoire, cela me rendrait un fier service.

    Merci d'avance à ceux ou celles qui auront le temps de se pencher sur mon message.
    Cordialement.
    Michèle

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Cela me semble dans l'ensemble assez juste.

    Je ne suis pas capable de répondre sur la question de l'exponentiel.

    En regardant les résultats, tu ne parles pas de Intercept qui lui aussi est pertinent.

    La régression logistique semble être le bon choix. Tu sommes des événements binaires.

    Par contre j'ai tout de même un doute sur la seconde régression, parce que tu ne retrouves pas les premiers résultats de la première régression. Ton ADN et ton Expert ne sont pas significatifs. Or l'inverse de la p value est proche de 1. Je trouve cela curieux.

    Cordialement.

  3. #3
    Nouveau Candidat au Club
    Femme Profil pro
    Retraitée
    Inscrit en
    Juin 2014
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Maroc

    Informations professionnelles :
    Activité : Retraitée

    Informations forums :
    Inscription : Juin 2014
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup de t'être penché sur ma problématique.
    En effet je suis très surprise d'avoir un effet par addition des variables ADN et EXPERT et pas d'effet significatif (loin de là d'ailleurs !!) avec une interaction ADN/EXPERT.
    Malheureusement, et bien que je sois très intéressée par les statistiques, je n'ai pas une formation suffisante pour en tirer des conclusions judicieuses.
    Je vais envoyer mes résultats et mes conclusions à mon Directeur de mémoire et j'espère qu'il m'aidera un peu.
    Je fais ma formation pour le plaisir (je suis retraitée et j'en profite pour reprendre des études) par correspondance à l'Université de Paris 8 - IED et contrairement à ce que de nombreuses personnes pensent la licence de psychologie et a fortiori le master nécessite une bonne connaissance des statistiques, domaine que je n'ai découvert que très tardivement (formation littéraire de base). Mais je continue à m'accrocher et j'espère être en mesure de terminer ce mémoire qui porte sur la perception d'innocence/culpabilité des jurés avant leur entrée dans la chambre des délibérés.

    Encore merci pour ce coup de main et si d'autres personnes souhaitent me donner leur avis, il sera le bienvenu.
    Cordialement.
    Michèle

  4. #4
    Nouveau membre du Club
    Homme Profil pro
    Enseignant
    Inscrit en
    Mai 2013
    Messages
    25
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Mai 2013
    Messages : 25
    Points : 30
    Points
    30
    Par défaut
    Bonsoir,

    La régression logistique binaire est effectivement un bon choix.
    Le calcul de vos odd-ratios sont bons (e^estimate).

    En ce qui concerne la non-significativité de ton terme d'interaction.
    Cela peut vouloir dire que le terme d'interaction est fortement colinéaire avec une des deux variables prise individuellement. Peut être parce que l'une d'entre elles comporte une forte proportion de 1 (ou inversement de 0) par ex. Du coup, du fait de la colinéarité, les termes se gênent dans la régression.

    Bien à toi,
    Et je tenais à te féliciter de la reprise d'études tardives. Courage dans cette entreprise.

Discussions similaires

  1. Réponses: 0
    Dernier message: 23/10/2009, 23h37
  2. Recherche aide rénumérée pour mémoire
    Par supermumubu dans le forum Demandes
    Réponses: 0
    Dernier message: 04/08/2007, 11h57
  3. Algorithme d'indexation pour moteur de recherche
    Par caspertn dans le forum Algorithmes et structures de données
    Réponses: 7
    Dernier message: 24/04/2006, 16h57
  4. Problème requete pour moteur de recherche
    Par vincedjs dans le forum Requêtes
    Réponses: 48
    Dernier message: 15/03/2006, 14h47
  5. [LDAP] comment s'y prendre pour faire une recherche complexe
    Par dervish dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 10/03/2006, 14h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo