Bonjour,
Je suis actuellement en master 1 de psychologie sociale et je fais un mémoire de recherche.
J'ai fait des statistiques pendant les 3 années de licence plus l'année de master, mais je n'ai pas eu l'occasion d'utiliser la régression logistique.
J'ai une petite connaissance du logiciel R et j'ai suivi dernièrement un MOOC qui y était consacré.
Je suis aujourd'hui confrontée à l'analyse de mes données et je ne voudrais pas partir sur de mauvaises bases.
Ma variable à expliquer est binaire (coupable = 0/non coupable = 1). Mes variables explicatives sont au nombre de deux : Test ADN négatif = 1/pas de test ADN = 0, ainsi que Présence d'un expert = 1, pas de présence d'un expert = 0.

J'ai utilisé la fonction "glm" sous R et j'ai obtenu les résultats suivants :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
glm(formula = Culpabilite ~ ADN + Expert, family = binomial(logit), 
    data = essais3)
 
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.2848  -0.5452  -0.4294  -0.1549   2.2043  
 
Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -4.4176     0.9814  -4.501 6.75e-06 ***
ADN           2.0803     0.7433   2.799  0.00513 ** 
Expert        2.5863     0.8375   3.088  0.00202 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
 
(Dispersion parameter for binomial family taken to be 1)
 
    Null deviance: 80.064  on 79  degrees of freedom
Residual deviance: 57.986  on 77  degrees of freedom
AIC: 63.986
 
Number of Fisher Scoring iterations: 6
 
 
Rcmdr>  GLM.2 <- glm(Culpabilite ~ ADN*Expert, family=binomial(logit), data=essais3)
 
Rcmdr>  summary(GLM.2)
 
Call:
glm(formula = Culpabilite ~ ADN * Expert, family = binomial(logit), 
    data = essais3)
 
Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-1.26373  -0.57012  -0.45904  -0.00008   2.14597  
 
Coefficients:
            Estimate Std. Error z value Pr(>|z|)
(Intercept)   -19.57    2404.67  -0.008    0.994
ADN            17.37    2404.67   0.007    0.994
Expert         17.83    2404.67   0.007    0.994
ADN:Expert    -15.43    2404.67  -0.006    0.995
 
(Dispersion parameter for binomial family taken to be 1)
 
    Null deviance: 80.064  on 79  degrees of freedom
Residual deviance: 57.437  on 76  degrees of freedom
AIC: 65.437
 
Number of Fisher Scoring iterations: 18
 
> exp(coefficients(mod1))
(Intercept)         ADN      Expert 
 0.01206335  8.00672440 13.27997835
Ci-dessous l'interprétation que je fais de ces résultats.
En ce qui concerne la première régression : le p est inférieur à 0.05 ce qui signifie que les deux variables (ADN et EXPERT) sont associées à un verdict "non coupable". Les coefficients "estimate" sont respectivement 2.0803 et 2.5863 ; ils sont positifs ce qui confirme qu'un test ADN négatif est statistiquement associé à un verdict "Non coupable" et que la présence d'un expert est statistiquement associé à un verdict "Non coupable".
Enfin, le calcul de l'exponentiel des coefficients montre que la présence d'un test ADN négatif multiplie par 8 (8.0067) la possibilité d'un verdict "non coupable" et la présence d'un expert multiplie cette possibilité par 13 (13,2799).

Par contre si on regarde la 2ème régression logistique où il y a une possible interaction entre ADN et expert, on constate que le p est supérieur à 0.05, on ne peut donc pas déduire qu'il y a une synergie entre ADN et EXPERT.

Si quelqu'un parmi vous pouvait me dire si le choix de la régression logistique est le bon choix et si mon interprétation des résultats semble acceptable pour la rédaction d'un mémoire, cela me rendrait un fier service.

Merci d'avance à ceux ou celles qui auront le temps de se pencher sur mon message.
Cordialement.
Michèle