Bonjour
J'ai un jeu de données où je cherche à expliquer une variable (meilleurs temps) par rapport à plusieurs (sexe, genotype, année de naissance, pays,...).
J'ai réalisé une régression linéaire multiple puis une anova.
J'ai du mal à expliquer certains résultats :
- Pourquoi dans le test lm pour mes années de naissance certaines sont significatives et la plupart non alors que dans l'anova qui est la variable complète, la variable ne l'est pas ?
- Pourquoi le sexe (mis sous forme S pour jument et H pour hongre) ne présente aucune significativité dans la régression linéaire alors que la variable l'est dans l'anova ?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48 Call: lm(formula = besttime ~ sex + birthyear + nbpartant + country + genotype.1, data = test) Residuals: Min 1Q Median 3Q Max -4.9446 -0.9851 -0.0194 1.0113 4.2586 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 77.263500 0.866684 89.148 < 2e-16 *** sexS 0.488079 0.652567 0.748 0.45539 sexV 0.395414 0.660082 0.599 0.54984 birthyear2004 -0.144891 0.538829 -0.269 0.78829 birthyear2005 -0.298223 0.493057 -0.605 0.54598 birthyear2006 -0.438454 0.528276 -0.830 0.40756 birthyear2007 -0.297719 0.565162 -0.527 0.59894 birthyear2008 -0.418721 0.539245 -0.776 0.43839 birthyear2009 -0.655917 0.496589 -1.321 0.18809 birthyear2010 -1.281097 0.599536 -2.137 0.03385 * birthyear2011 -0.838719 0.501435 -1.673 0.09599 . birthyear2012 -1.198756 0.573675 -2.090 0.03794 * birthyear2013 -1.668117 0.500936 -3.330 0.00104 ** birthyear2014 -1.527220 0.737456 -2.071 0.03967 * nbpartant -0.061971 0.005196 -11.926 < 2e-16 *** countrySE 0.469868 0.284815 1.650 0.10059 genotype.1AG 0.363107 0.374454 0.970 0.33339 genotype.1GG 0.097949 0.382520 0.256 0.79817 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 1.708 on 197 degrees of freedom Multiple R-squared: 0.4543, Adjusted R-squared: 0.4072 F-statistic: 9.646 on 17 and 197 DF, p-value: < 2.2e-16 anova(lm) Analysis of Variance Table Response: besttime Df Sum Sq Mean Sq F value Pr(>F) sex 2 22.03 11.02 3.7777 0.02455 * birthyear 11 34.21 3.11 1.0664 0.39033 nbpartant 1 410.02 410.02 140.6104 < 2e-16 *** country 1 7.43 7.43 2.5469 0.11212 genotype.1 2 4.46 2.23 0.7653 0.46659 Residuals 197 574.46 2.92 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Je commence à m'emmeler les pinceaux entre le test lm et l'anova . Si quelqu'un pouvait m'aider quand à l'interpretation des résultats. Je sais que mon R2 n'est pas élevé et le modèle d'un faible niveau mais il s'agit du meilleur que j'ai pu obtenir avec ces variables.
Merci.
Bonne journée !
Partager