IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Question pour une recherche en biostatistique


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut Question pour une recherche en biostatistique
    Bonjour, ayant très peu de notion en statistique, et malgrés mes recherches, j'ai quelques doutes quand à l'exploitation de mes résultats.
    Je teste deux techniques sur un même patient, et le but est de voir si les deux techniques sont reproductibles ou pas.
    A la base, je voulais partir sur un test de student apparié (n = 20), et tester la normalité de mes deux series de mesures pour pouvoir l'utiliser. Apres reflexion, il me parait plus judicieux de tester la normalité sur ma série de valeur ou je fais a chaque fois la différence des deux. Sauf que la, la série ne suit plus une loi normale (avec le test Shapiro Wilk), donc puisque je ne peux pas utiliser le T test, quand je regarde des cours, dans ces cas là c'est marqué qu'on utilise le test de Walsh apparié, sauf que je ne trouve rien la dessus pour effectuer ce test.
    Je ne sais pas du tout si je pars bien ou pas du tout !
    Merci d'avance pour vos conseils.
    Cordialement

  2. #2
    Invité
    Invité(e)
    Par défaut
    En théorie sur des données non issues de populations distribuées normalement tu ne peux pas appliquer un student. Un Wilcoxon sera plus adapté. Tu peux faire passer les valeurs ?

    Sous R pour l'utiliser tu as l'aide avec ?wilcox.test où il faudra passer l'argument paired=T
    Dernière modification par dourouc05 ; 03/05/2017 à 14h06. Motif: Inutile de citer le message précédent complètement.

  3. #3
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    En fait si je teste la normalité sur mes deux séries de valeur, chacune d'entres elle suit une loi normale, donc je peux faire le t test
    Le soucis est que comme je veux faire la reproductibilité des mesures, je me dit que je devrais peut etre tester la normalité sur la série des différences de valeurs à chaque mesure, et la dans ce cas cela ne suit pas une loi normal.
    Qu'en pensez vous ? Devrais je garder mes deux series ou prendre la serie des différences entre les deux ?
    Et puis je utiliser Wilcoxon sachant que j'ai des "vraies" valeurs et pas des fréquences ?
    Merci à vous

  4. #4
    Invité
    Invité(e)
    Par défaut
    Citation Envoyé par Luciole17 Voir le message
    En fait si je teste la normalité sur mes deux séries de valeur, chacune d'entres elle suit une loi normale, donc je peux faire le t test
    Pour faire un t test il faut, en plus de la normalité des distributions être certain que la taille d'échantillon est suffisante (moi je me pose 30 comme limite inférieure même si l'on peut en faire à moins) et aussi de l'homogénéité des variances (ce que l'on peut vérifier avec var.test() sous R).

    Citation Envoyé par Luciole17 Voir le message
    Le soucis est que comme je veux faire la reproductibilité des mesures, je me dit que je devrais peut etre tester la normalité sur la série des différences de valeurs à chaque mesure, et la dans ce cas cela ne suit pas une loi normal. Qu'en pensez vous ? Devrais je garder mes deux series ou prendre la serie des différences entre les deux ?
    Les deux approches sont recevables mais il faudrait voir les données pour aller plus loin

    Citation Envoyé par Luciole17 Voir le message
    Et puis je utiliser Wilcoxon sachant que j'ai des "vraies" valeurs et pas des fréquences ?
    Merci à vous
    Absolument, le Mann-Whitney-Wilcoxon n'est pas du tout dédié aux fréquences.

  5. #5
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    D'accord, quand je teste les variances sous excel (je pense que j'ai du faire une erreur) j'ai une variance à 2 et l'autres à 30, ça me parait un peu beaucoup en différence je vais revoir ça.
    Voici mes valeurs, je dois avoir 20 patients, pour l'instant j'en ai 18, mais j'ai jusque la fin du mois, mais voila déjà a quoi ça ressemble (vous pourrez me dire s'il vaut mieux que j'étudie les séries ou la différence entre elle) :
    Patients SSI (kPa) ARFI (kPa) Différence (kPa)
    1 25.5 14.5 11
    2 29.3 23.1 6,24
    3 18.26 14.1 4,16
    4 28.5 22 6,5
    5 23.24 24.7 1,5
    6 21.3 14 7,3
    7 22 11 11
    8 21.4 19.9 1.5
    9 22.1 22.4 0.3
    10 28.6 29.7 1.1
    11 24 17.9 6.1
    12 20.3 20.2 0.1
    13 12.9 14.3 1.4
    14 29.2 30.06 0.86
    15 29.1 24.9 4.2
    16 16.12 12.4 3.72
    17 17.4 15.8 1.6
    18 22.9 25.3 2.4

    Qu'en pensez vous ?

    Patient / ARFI (kPa) / SSI (kPa) / Diff (kPa)
    1 / 25.5 / 14.5 / 11
    2 / 29.3 / 23.1 / 6.24
    3 / 18.26 / 14.1 / 4.16
    4 / 28.5 / 22 / 6.5
    5 / 23.24 / 24.7 / 1.5
    6 / 21.3 / 14 / 7.3
    7 / 22 / 11 / 11
    8 / 21.4 / 19.9 / 1.5
    9 / 22.1 / 22.4 / 0.3
    10 / 28.6 / 29.7 / 1.1
    11 / 24 / 17.9 /6.1
    12 / 20.3 / 20.2 / 0.1
    13 / 12.9 / 14.3 / 1.4
    14 / 29.2 / 30.06 / 0.86
    15 / 29.1 / 24.9 / 4.2
    16 / 16.12 / 12.4 / 3.72
    17 / 17.4 / 15.8 / 1.6
    18 / 22.9 / 25.3 /2.4

    J'espere que c'est plus lisible ...

  6. #6
    Invité
    Invité(e)
    Par défaut
    J'en pense que :
    - tu mélanges les "." et les ","
    - tes différences sont fausses car il doit y avoir des des valeurs négatives ... à moins que tu ne t'intéresses qu'aux valeurs absolues des différences
    - tes 2 échantillons (shapiro.wilk) ont des distributions normales (p-value de 0.3017 pour SSI et 0.3469 pour ARFI)
    - la différence suit également une distribution normale (p-value = 0.1287)
    - la valeur absolue des différences, comme ou pouvait s'y attendre, ne suit pas une distribution normale car elle introduit un biais (p-value = 0.02493)
    - les variances sont homogènes (p-value = 0.4519)
    - avec cette taille d'échantillon on peut envisager un t.test (p-value = 0.006412) et un Mann-Whitney-Wilcoxon sur échantillons appariés donne une p-value de 0.01472 donc il semble que l'on puisse rejeter H0 au risque 5% à ce stade.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
         SSI  ARFI   DIFF
    1  25.50 14.50 -11.00
    2  29.30 23.10  -6.20
    3  18.26 14.10  -4.16
    4  28.50 22.00  -6.50
    5  23.24 24.70   1.46
    6  21.30 14.00  -7.30
    7  22.00 11.00 -11.00
    8  21.40 19.90  -1.50
    9  22.10 22.40   0.30
    10 28.60 29.70   1.10
    11 24.00 17.90  -6.10
    12 20.30 20.20  -0.10
    13 12.90 14.30   1.40
    14 29.20 30.06   0.86
    15 29.10 24.90  -4.20
    16 16.12 12.40  -3.72
    17 17.40 15.80  -1.60
    18 22.90 25.30   2.40

  7. #7
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    d'accord je comprend mieux, mais effectivement ce sont toujours des valeurs possitives. On s'interesse a l'élasticité des tissues donc il n'y a jamais de valeur négative, même pour les différences c'est toujours positifs.
    Je vous embête une derniere fois, pensez vous qu'il faut que je reste sur la normalité de mes deux séries et partir sur un T test, ou la différence qui ne suit pas la loi normale et wilcoxon ?
    Sachant qu'en fait les deux techniques servent à la même chose, il diffère un petit peu dans la technique. On veut savoir si on obtient les mêmes valeurs, si elles sont reproductibles.
    Je vous remercie (énormément !)

  8. #8
    Invité
    Invité(e)
    Par défaut
    Ce que je ferai pour ma part ce serait de travailler sur les deux séries en comparaison et pas sur la différence. Ensuite il y a deux écoles selon la taille d'échantillon mais comme il n'est pas trop petit ici un t.test reste applicable.

  9. #9
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2017
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2017
    Messages : 5
    Points : 1
    Points
    1
    Par défaut
    Très bien, je vous remercie pour vos précieux conseils !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 16
    Dernier message: 05/08/2006, 11h07
  2. Syntaxe pour une recherche sur 2 listes déroutantes
    Par christ-94 dans le forum Access
    Réponses: 2
    Dernier message: 24/05/2006, 17h51
  3. [2D] Mini-projet : question pour une interface graphique
    Par kitsune dans le forum Développement 2D, 3D et Jeux
    Réponses: 15
    Dernier message: 10/03/2006, 14h59
  4. Importance des accents pour une recherche dans postgre
    Par glouf dans le forum PostgreSQL
    Réponses: 4
    Dernier message: 05/03/2005, 13h25
  5. [VB.NET] Quel objet tableau pour une recherche indexée ???
    Par Kitano dans le forum Windows Forms
    Réponses: 7
    Dernier message: 02/09/2004, 09h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo