Bonjour à tous,

Je dispose d'un jeu de donnée représentant des individus de professions différentes (variable qualitative), et leur nombre d'enfants (variable quantitative). Je souhaiterais voir s'il y a une relation entre la profession et le nombre d'enfants.

Jeu de donnée : https://drive.google.com/open?id=1ci...TorlaknvJbgZUn

Pour ce test, j'utilise le test anova sur R.

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
 
analyse_variance = aov(data$n.enfant~data$prof)
 
summary(analyse_variance)
J'obtiens ce résultat :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
 
             Df Sum Sq Mean Sq F value  Pr(>F)   
data$prof     7     77  11.000    3.38 0.00147 **
Residuals   762   2480   3.255                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
29 observations deleted due to missingness
Malheureusement, je ne sais pas trop comment interpréter ce résultat. Le Pr(>F) semble petit, je peux donc affirmer que ce résultat n'est pas dû au hasard (et qu'il existe donc un lien entre la profession et le nombre d'enfants ?). Cependant, la F Value me semble assez énorme, je ne sais pas à quoi il correspond ...

Merci à vous.