Bonjour,
Je suis actuellement en master 1 de psychologie sociale et je fais un mémoire de recherche.
J'ai fait des statistiques pendant les 3 années de licence plus l'année de master, mais je n'ai pas eu l'occasion d'utiliser la régression logistique.
J'ai une petite connaissance du logiciel R et j'ai suivi dernièrement un MOOC qui y était consacré.
Je suis aujourd'hui confrontée à l'analyse de mes données et je ne voudrais pas partir sur de mauvaises bases.
Ma variable à expliquer est binaire (coupable = 0/non coupable = 1). Mes variables explicatives sont au nombre de deux : Test ADN négatif = 1/pas de test ADN = 0, ainsi que Présence d'un expert = 1, pas de présence d'un expert = 0.
J'ai utilisé la fonction "glm" sous R et j'ai obtenu les résultats suivants :
Ci-dessous l'interprétation que je fais de ces résultats.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54 glm(formula = Culpabilite ~ ADN + Expert, family = binomial(logit), data = essais3) Deviance Residuals: Min 1Q Median 3Q Max -1.2848 -0.5452 -0.4294 -0.1549 2.2043 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -4.4176 0.9814 -4.501 6.75e-06 *** ADN 2.0803 0.7433 2.799 0.00513 ** Expert 2.5863 0.8375 3.088 0.00202 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 80.064 on 79 degrees of freedom Residual deviance: 57.986 on 77 degrees of freedom AIC: 63.986 Number of Fisher Scoring iterations: 6 Rcmdr> GLM.2 <- glm(Culpabilite ~ ADN*Expert, family=binomial(logit), data=essais3) Rcmdr> summary(GLM.2) Call: glm(formula = Culpabilite ~ ADN * Expert, family = binomial(logit), data = essais3) Deviance Residuals: Min 1Q Median 3Q Max -1.26373 -0.57012 -0.45904 -0.00008 2.14597 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -19.57 2404.67 -0.008 0.994 ADN 17.37 2404.67 0.007 0.994 Expert 17.83 2404.67 0.007 0.994 ADN:Expert -15.43 2404.67 -0.006 0.995 (Dispersion parameter for binomial family taken to be 1) Null deviance: 80.064 on 79 degrees of freedom Residual deviance: 57.437 on 76 degrees of freedom AIC: 65.437 Number of Fisher Scoring iterations: 18 > exp(coefficients(mod1)) (Intercept) ADN Expert 0.01206335 8.00672440 13.27997835
En ce qui concerne la première régression : le p est inférieur à 0.05 ce qui signifie que les deux variables (ADN et EXPERT) sont associées à un verdict "non coupable". Les coefficients "estimate" sont respectivement 2.0803 et 2.5863 ; ils sont positifs ce qui confirme qu'un test ADN négatif est statistiquement associé à un verdict "Non coupable" et que la présence d'un expert est statistiquement associé à un verdict "Non coupable".
Enfin, le calcul de l'exponentiel des coefficients montre que la présence d'un test ADN négatif multiplie par 8 (8.0067) la possibilité d'un verdict "non coupable" et la présence d'un expert multiplie cette possibilité par 13 (13,2799).
Par contre si on regarde la 2ème régression logistique où il y a une possible interaction entre ADN et expert, on constate que le p est supérieur à 0.05, on ne peut donc pas déduire qu'il y a une synergie entre ADN et EXPERT.
Si quelqu'un parmi vous pouvait me dire si le choix de la régression logistique est le bon choix et si mon interprétation des résultats semble acceptable pour la rédaction d'un mémoire, cela me rendrait un fier service.
Merci d'avance à ceux ou celles qui auront le temps de se pencher sur mon message.
Cordialement.
Michèle
Partager