LM et Anova : différence et test
Bonjour
J'ai un jeu de données où je cherche à expliquer une variable (meilleurs temps) par rapport à plusieurs (sexe, genotype, année de naissance, pays,...).
J'ai réalisé une régression linéaire multiple puis une anova.
J'ai du mal à expliquer certains résultats :
- Pourquoi dans le test lm pour mes années de naissance certaines sont significatives et la plupart non alors que dans l'anova qui est la variable complète, la variable ne l'est pas ?
- Pourquoi le sexe (mis sous forme S pour jument et H pour hongre) ne présente aucune significativité dans la régression linéaire alors que la variable l'est dans l'anova ?
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
| Call:
lm(formula = besttime ~ sex + birthyear + nbpartant + country +
genotype.1, data = test)
Residuals:
Min 1Q Median 3Q Max
-4.9446 -0.9851 -0.0194 1.0113 4.2586
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 77.263500 0.866684 89.148 < 2e-16 ***
sexS 0.488079 0.652567 0.748 0.45539
sexV 0.395414 0.660082 0.599 0.54984
birthyear2004 -0.144891 0.538829 -0.269 0.78829
birthyear2005 -0.298223 0.493057 -0.605 0.54598
birthyear2006 -0.438454 0.528276 -0.830 0.40756
birthyear2007 -0.297719 0.565162 -0.527 0.59894
birthyear2008 -0.418721 0.539245 -0.776 0.43839
birthyear2009 -0.655917 0.496589 -1.321 0.18809
birthyear2010 -1.281097 0.599536 -2.137 0.03385 *
birthyear2011 -0.838719 0.501435 -1.673 0.09599 .
birthyear2012 -1.198756 0.573675 -2.090 0.03794 *
birthyear2013 -1.668117 0.500936 -3.330 0.00104 **
birthyear2014 -1.527220 0.737456 -2.071 0.03967 *
nbpartant -0.061971 0.005196 -11.926 < 2e-16 ***
countrySE 0.469868 0.284815 1.650 0.10059
genotype.1AG 0.363107 0.374454 0.970 0.33339
genotype.1GG 0.097949 0.382520 0.256 0.79817
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 1.708 on 197 degrees of freedom
Multiple R-squared: 0.4543, Adjusted R-squared: 0.4072
F-statistic: 9.646 on 17 and 197 DF, p-value: < 2.2e-16
anova(lm)
Analysis of Variance Table
Response: besttime
Df Sum Sq Mean Sq F value Pr(>F)
sex 2 22.03 11.02 3.7777 0.02455 *
birthyear 11 34.21 3.11 1.0664 0.39033
nbpartant 1 410.02 410.02 140.6104 < 2e-16 ***
country 1 7.43 7.43 2.5469 0.11212
genotype.1 2 4.46 2.23 0.7653 0.46659
Residuals 197 574.46 2.92
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 |
Je commence à m'emmeler les pinceaux entre le test lm et l'anova . Si quelqu'un pouvait m'aider quand à l'interpretation des résultats. Je sais que mon R2 n'est pas élevé et le modèle d'un faible niveau mais il s'agit du meilleur que j'ai pu obtenir avec ces variables.
Merci.
Bonne journée !