Bonjour

J'ai un jeu de données où je cherche à expliquer une variable (meilleurs temps) par rapport à plusieurs (sexe, genotype, année de naissance, pays,...).
J'ai réalisé une régression linéaire multiple puis une anova.
J'ai du mal à expliquer certains résultats :
- Pourquoi dans le test lm pour mes années de naissance certaines sont significatives et la plupart non alors que dans l'anova qui est la variable complète, la variable ne l'est pas ?
- Pourquoi le sexe (mis sous forme S pour jument et H pour hongre) ne présente aucune significativité dans la régression linéaire alors que la variable l'est dans l'anova ?

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
Call:
lm(formula = besttime ~ sex + birthyear + nbpartant + country + 
    genotype.1, data = test)
 
Residuals:
    Min      1Q  Median      3Q     Max 
-4.9446 -0.9851 -0.0194  1.0113  4.2586 
 
Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)   77.263500   0.866684  89.148  < 2e-16 ***
sexS           0.488079   0.652567   0.748  0.45539    
sexV           0.395414   0.660082   0.599  0.54984    
birthyear2004 -0.144891   0.538829  -0.269  0.78829    
birthyear2005 -0.298223   0.493057  -0.605  0.54598    
birthyear2006 -0.438454   0.528276  -0.830  0.40756    
birthyear2007 -0.297719   0.565162  -0.527  0.59894    
birthyear2008 -0.418721   0.539245  -0.776  0.43839    
birthyear2009 -0.655917   0.496589  -1.321  0.18809    
birthyear2010 -1.281097   0.599536  -2.137  0.03385 *  
birthyear2011 -0.838719   0.501435  -1.673  0.09599 .  
birthyear2012 -1.198756   0.573675  -2.090  0.03794 *  
birthyear2013 -1.668117   0.500936  -3.330  0.00104 ** 
birthyear2014 -1.527220   0.737456  -2.071  0.03967 *  
nbpartant     -0.061971   0.005196 -11.926  < 2e-16 ***
countrySE      0.469868   0.284815   1.650  0.10059    
genotype.1AG   0.363107   0.374454   0.970  0.33339    
genotype.1GG   0.097949   0.382520   0.256  0.79817    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 
Residual standard error: 1.708 on 197 degrees of freedom
Multiple R-squared:  0.4543,	Adjusted R-squared:  0.4072 
F-statistic: 9.646 on 17 and 197 DF,  p-value: < 2.2e-16
 
anova(lm)
Analysis of Variance Table
 
Response: besttime
            Df Sum Sq Mean Sq  F value  Pr(>F)    
sex          2  22.03   11.02   3.7777 0.02455 *  
birthyear   11  34.21    3.11   1.0664 0.39033    
nbpartant    1 410.02  410.02 140.6104 < 2e-16 ***
country      1   7.43    7.43   2.5469 0.11212    
genotype.1   2   4.46    2.23   0.7653 0.46659    
Residuals  197 574.46    2.92                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Je commence à m'emmeler les pinceaux entre le test lm et l'anova . Si quelqu'un pouvait m'aider quand à l'interpretation des résultats. Je sais que mon R2 n'est pas élevé et le modèle d'un faible niveau mais il s'agit du meilleur que j'ai pu obtenir avec ces variables.
Merci.

Bonne journée !