Bonsoir tout le monde,

Étudiant en dernière année en mathématique à l’université je termine un de mes travaux en analyse multi variées. Mon but est d’étudier une base de données réelle de surfer. Ils sont 4 : Surfer A, B, C et D.
Chaque ligne de ma base de donnée correspond à une session de surf. Elle a plusieurs variables quantitatives telles que le nombre de calories brûlées, la vitesse moyenne, le nombre de vague etc. J’ai déjà réalisé une ACP. A présent j’aimerais réaliser une ANOVA sur par exemple la vitesse moyenne en fonction du type de surfer (A, B, C ou D).
Le problème est que peu importe la variable quantitative que je choisis, le test de Bartlett ou de Shapiro me renvoient une p-valeur de 2e-16. Les données sont pourtant de qualité il me semble, avec quelques outliers tout de même.
J’ai donc essayé le test de Kruskal qui est moins exigeant que l’Anova mais j’ai également 2e-16. Serait-une erreur de codage ou simplement une preuve que la base de données n’est pas terrible ?

Ci-joint un exemple de QQPLOT et un exemple de p valeur que me renvoie le test de Shapiro

Si vous avez besoin de plus de renseignements sur la Base de données, de graphe ou quoi que ce soit n'hésitez pas,

Merci d’avance

Hugo