Les conditions d’application du test de Student (et autres méthodes paramétriques)

Bonjour a tous.

Voici une question qui m’agace quelque peu à intervalles régulier depuis mes études de statistiques ; non pas parce que je n’ai pas la réponse mais parce que j’ai trop de réponses. :-)

I) Le rappel du contexte

Le test de student compare les moyennes des deux échantillons (par exemple le taux d’une hormone pour des patients ayant reçu un traitement A et pour des patients ayant reçu un traitement B). Il détermine avec quelle probabilité, la supériorité observée de la moyenne d’un échantillon rapport à la moyenne de l’autre est dans le même sens que celle qu’on aurait observée si on avait appliqué à la population générale.

Ce test suppute que dans chaque échantillon les observations suivent une distribution normale.

II) Le rappel des problèmes que ça pose.

1) En vrai, les distributions des données réelles ne suivent quasiment jamais parfaitement une loi normale. Déjà pour une raison toute bête : Les données sont recueillies avec un certain nombre de chiffres significatifs (généralement 2 à 4) donc elles suivent forcement une distribution discrète.

2) Les tests paramétriques sont plus puissants que les tests nom paramétriques (type Wilcoxon). Donc du point de vu de la structure qui réalise l’étude (par exemple un labo qui test son traitement contre l’existant) c’est toujours «plus intéressant» d’appliquer ce test de student qu’un test de Wilcoxon par exemple.

III) Quelques propositions de conditions

Pour savoir quand utiliser

a) Comme sur ce site http://www.sthda.com/french/wiki/tes...r-des-moyennes il est suggéré d’utiliser un test de normalité (par exemple Shapiro-Wilk) pour les petits échantillons (n < 30). On est alors «autorisé» à utiliser le test de student si le test de normalité est non-concluant.

b) Mais j’ai déjà entendu l’avis qu’il faudrait utiliser toujours le test de normalité par exemple.

Le problème que j’ai avec la version b) c’est que toutes les distributions de données réelles étant généralement non-normales, plus l’échantillon est important, plus les chances que le test de Shapiro-Wilk soit concluant augmente. Ainsi la structure qui réalise l’étude peut se retrouver «pénalisée» par le fait d’avoir un échantillon plus grand, parce que cet échantillon plus grand va rendre le test de Shapiro-Wilk plus probablement concluant et ainsi «interdire» l’utilisation du test de student.

IV) Exemple de cas extrême

Voici un cas extrême qui me turlupine. Supposons que vous avez seulement 2 patients dans chaque groupe. A1 et A1 qui ont reçu le traitement A, pendant que B1 et B2 ont reçu les traitements B. Si A1 = A2 ≠ B1 = B2 alors le test de student va être concluant (car les variances estimées dans les sous-groupes sont nulles). Pour autant est-ce que vous trouvez cela satisfaisant ?

On rejoint ici la question du nombre de chiffres significatifs évoqué en partie (III). A1 = A2 et B1 = B2 mais sans-doute qu’avec une meilleure précision ce ne serait pas le cas.

Au-delà de ce cas extrême c’est la question de «jusqu’a combien de patient on peut se permettre de descendre» ? Sachant que les tests paramétriques peuvent-être concluant à partir de 4 contrairement aux tests non paramétriques qui nécessiteront plus de patients (au moins 8 pour avoir un résultat concluant avec un seuil à 5% il me semble).

V) Mes questions :

a) Y-a-t-il pour vous un nombre minimum de patients en dessous duquel en tant que statisticien vous direz toujours qu’on ne peut rien conclure quelles que soient les données ?

b) Est-ce que pour vous considerez le test invalide si la variance dans les sous-groupe est nulle comme évoqué dans la partie (IV) ?

c) Quelles conditions appliquez-vous pour autoriser un test de student ?

d) Y-a-t-il a votre connaissance une instance qui fasse «autorité» sur ce type de questions ?