Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Nouveau membre du Club
    Les conditions d’application du test de Student (et autres méthodes paramétriques)
    Bonjour a tous.

    Voici une question qui m’agace quelque peu à intervalles régulier depuis mes études de statistiques ; non pas parce que je n’ai pas la réponse mais parce que j’ai trop de réponses. :-)


    I) Le rappel du contexte

    Le test de student compare les moyennes des deux échantillons (par exemple le taux d’une hormone pour des patients ayant reçu un traitement A et pour des patients ayant reçu un traitement B). Il détermine avec quelle probabilité, la supériorité observée de la moyenne d’un échantillon rapport à la moyenne de l’autre est dans le même sens que celle qu’on aurait observée si on avait appliqué à la population générale.

    Ce test suppute que dans chaque échantillon les observations suivent une distribution normale.


    II) Le rappel des problèmes que ça pose.

    1) En vrai, les distributions des données réelles ne suivent quasiment jamais parfaitement une loi normale. Déjà pour une raison toute bête : Les données sont recueillies avec un certain nombre de chiffres significatifs (généralement 2 à 4) donc elles suivent forcement une distribution discrète.

    2) Les tests paramétriques sont plus puissants que les tests nom paramétriques (type Wilcoxon). Donc du point de vu de la structure qui réalise l’étude (par exemple un labo qui test son traitement contre l’existant) c’est toujours «plus intéressant» d’appliquer ce test de student qu’un test de Wilcoxon par exemple.


    III) Quelques propositions de conditions

    Pour savoir quand utiliser

    a) Comme sur ce site http://www.sthda.com/french/wiki/tes...r-des-moyennes il est suggéré d’utiliser un test de normalité (par exemple Shapiro-Wilk) pour les petits échantillons (n < 30). On est alors «autorisé» à utiliser le test de student si le test de normalité est non-concluant.

    b) Mais j’ai déjà entendu l’avis qu’il faudrait utiliser toujours le test de normalité par exemple.

    Le problème que j’ai avec la version b) c’est que toutes les distributions de données réelles étant généralement non-normales, plus l’échantillon est important, plus les chances que le test de Shapiro-Wilk soit concluant augmente. Ainsi la structure qui réalise l’étude peut se retrouver «pénalisée» par le fait d’avoir un échantillon plus grand, parce que cet échantillon plus grand va rendre le test de Shapiro-Wilk plus probablement concluant et ainsi «interdire» l’utilisation du test de student.


    IV) Exemple de cas extrême

    Voici un cas extrême qui me turlupine. Supposons que vous avez seulement 2 patients dans chaque groupe. A1 et A1 qui ont reçu le traitement A, pendant que B1 et B2 ont reçu les traitements B. Si A1 = A2 &#8800; B1 = B2 alors le test de student va être concluant (car les variances estimées dans les sous-groupes sont nulles). Pour autant est-ce que vous trouvez cela satisfaisant ?

    On rejoint ici la question du nombre de chiffres significatifs évoqué en partie (III). A1 = A2 et B1 = B2 mais sans-doute qu’avec une meilleure précision ce ne serait pas le cas.

    Au-delà de ce cas extrême c’est la question de «jusqu’a combien de patient on peut se permettre de descendre» ? Sachant que les tests paramétriques peuvent-être concluant à partir de 4 contrairement aux tests non paramétriques qui nécessiteront plus de patients (au moins 8 pour avoir un résultat concluant avec un seuil à 5% il me semble).


    V) Mes questions :

    a) Y-a-t-il pour vous un nombre minimum de patients en dessous duquel en tant que statisticien vous direz toujours qu’on ne peut rien conclure quelles que soient les données ?

    b) Est-ce que pour vous considerez le test invalide si la variance dans les sous-groupe est nulle comme évoqué dans la partie (IV) ?

    c) Quelles conditions appliquez-vous pour autoriser un test de student ?

    d) Y-a-t-il a votre connaissance une instance qui fasse «autorité» sur ce type de questions ?

  2. #2
    Membre expérimenté
    Bonjour
    Je me pose les mêmes questions depuis longtemps, pour des raisons intellectuelles. Ma conviction actuelle est que les statistiques ne donnent jamais ou presque de résultat tranché, et que généralement les tests ne servent qu'à masquer l'ignorance ...
    Cela est particulièrement vrai dans le domaine médical, pour une raison impossible à quantifier qui est la multiplicité des facteurs non déterminés qui peuvent affecter la situation. De façon générale, les erreurs systématiques sont une limitation à la connaissance que les statistiques ne peuvent pas traiter.
    Chaque problème doit être considéré en particulier.Je suis bien sûr prêt à en discuter.
    Ce qui s'énonce clairement se conçoit bien ( Le hautbois)

###raw>template_hook.ano_emploi###