IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Tests d'hypothèse Discussion :

distribution observée/distribution théorique y=0


Sujet :

Tests d'hypothèse

  1. #1
    Nouveau membre du Club
    Profil pro
    Inscrit en
    mars 2012
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : mars 2012
    Messages : 69
    Points : 38
    Points
    38
    Par défaut distribution observée/distribution théorique y=0
    Bref aperçu de l'objectif:

    Je dispose d'un jeu de données de température corporelle d'organismes en fonction de la température de leur milieu. J'ai calculé la différence entre la température des organismes et la température du milieu dans lequel ils évoluent afin de déterminer si ceux-ci sont plus/moins chauds que leur environnement. S'ils sont plus chauds, le delta de T° calculé (T°organisme - T°milieu) doit-être positif. Au contraire, s'ils sont plus froids, ce delta doit être négatif.

    Je souhaiterais donc procéder à un test me permettant de déterminer si, globalement, la plupart de mes individus se situent en dessous de "0", ce qui signifierait qu'il sont plus froids. JE veux donc comparer d'un coté la distribution de mes individus (delta de température) et d'un autre coté une distribution théorique ou ceux-ci auraient pour valeur 0 (ni plus froids ni plus chaud, mais à la même température). C'est pour cela que je voulais utiliser le test de K-S qui permet de préciser l'hypothèse alternative, en l'occurrence pour moi ce serait "less" ici.

    Voila, j'espère avoir été clair
    Comment puis-je donc procéder dans mon cas? Quelle syntaxe pour le test K-S?

    Merci pour votre aide!

  2. #2
    Membre confirmé
    Inscrit en
    mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : mars 2013
    Messages : 208
    Points : 461
    Points
    461
    Par défaut
    Bonjour,

    Alors la tu me sembles un peu embrouillé donc on va essayer de redefinir les choses proprement et ensuite on verra si tu obtiens ce que tu veux

    Citation Envoyé par CupOfAppleTea Voir le message
    Bonjour,
    Je souhaite comparer une distribution observée à une distribution théorique uniforme (y=0).
    Déjà , sais tu ce qu'est une loi uniforme?
    y=0 ce n'est pas une loi uniforme, ou alors une "loi uniforme" sur [0,0]


    Si tu veux vraiment comparer tes observations à la distribution à valeur toujours nulle, alors pas besoin de se prendre la tête avec un test: tu regardes si tes observations sont toujours nulles. Si oui tu ne peux pas rejetter l'hypothèse que ca suit ta loi, et si il y a au moins une observation non nulle alors tu rejettes avec une pvalue de 0 et c'est tout!

    Donc question: à quelle loi veut tu comparer ta distribution observée?


    Si c'est une loi uniforme standard (dans [0,1]) alors tu fais :
    et c'est fini.

    Si c'est une autre loi, détaille nous laquelle et on te dira comment l'écrire sous R ou la simuler si il n'existe pas directement une fonction de base pour ca dans R.

    Edit:
    si c'est une loi uniforme sur [29.5,32.5] tu fais:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
     ks.test(x, "punif",29.5,32.5)

    De plus, je souhaiterais que la loi uniforme suive une valeur de 0 des valeurs 29.5 à 32.5 pour x.
    Cette phrase est incomprehensible.

  3. #3
    Nouveau membre du Club
    Profil pro
    Inscrit en
    mars 2012
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : mars 2012
    Messages : 69
    Points : 38
    Points
    38
    Par défaut
    Bref aperçu de l'objectif:

    Je dispose d'un jeu de données de température corporelle d'organismes en fonction de la température de leur milieu. J'ai calculé la différence entre la température des organismes et la température du milieu dans lequel ils évoluent afin de déterminer si ceux-ci sont plus/moins chauds que leur environnement. S'ils sont plus chauds, le delta de T° calculé (T°organisme - T°milieu) doit-être positif. Au contraire, s'ils sont plus froids, ce delta doit être négatif.

    Je souhaiterais donc procéder à un test me permettant de déterminer si, globalement, la plupart de mes individus se situent en dessous de "0", ce qui signifierait qu'il sont plus froids. JE veux donc comparer d'un coté la distribution de mes individus (delta de température) et d'un autre coté une distribution théorique ou ceux-ci auraient pour valeur 0 (ni plus froids ni plus chaud, mais à la même température). C'est pour cela que je voulais utiliser le test de K-S qui permet de préciser l'hypothèse alternative, en l'occurrence pour moi ce serait "less" ici.

    Voila, j'espère avoir été clair et en effet je pense que je me suis bien égaré avec cette histoire de loi uniforme. Comment puis-je donc procéder dans mon cas?

  4. #4
    Membre confirmé
    Inscrit en
    mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : mars 2013
    Messages : 208
    Points : 461
    Points
    461
    Par défaut
    Ok j'ai compris.
    Donc clairement la comparaison de la distribution des delta à une loi uniforme n'était pas adaptée à la problématique.

    Ce que je ferais à ta place, c'est un test de moyenne.


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    t.test(x=vecteurdesdelta, alternative ="two.sided")
    Te dira si la moyenne est significativement différente de 0

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    t.test(x=vecteurdesdelta, alternative ="less")
    Te dira si la moyenne est significativement inférieure à 0

  5. #5
    Nouveau membre du Club
    Profil pro
    Inscrit en
    mars 2012
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : mars 2012
    Messages : 69
    Points : 38
    Points
    38
    Par défaut
    C'est tout à fait ça!
    En revanche le seul problème est que dans l'un de mes cas, ni la normalité ni l'homoscédasticité ne sont respectées. C'est pour ça que je m'étais au départ orienté vers K-S qui est non-paramétrique. Y aurait-il une version non-paramétrique du test de student me permettant de faire la même analyse?

  6. #6
    Membre confirmé
    Inscrit en
    mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : mars 2013
    Messages : 208
    Points : 461
    Points
    461
    Par défaut
    Citation Envoyé par CupOfAppleTea Voir le message
    C'est tout à fait ça!
    En revanche le seul problème est que dans l'un de mes cas, ni la normalité ni l'homoscédasticité ne sont respectées.
    La normalité ce n'est pas un problème dès que tu as plus de ~30 observations avec le TCL.

    L'homoscédasticité je vois pas le rapport puisque tu ne modélises rien et que tu n'as donc pas de residus.

  7. #7
    Inactif  
    Profil pro
    " "
    Inscrit en
    janvier 2008
    Messages
    330
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : " "

    Informations forums :
    Inscription : janvier 2008
    Messages : 330
    Points : 254
    Points
    254
    Par défaut
    Bonjour,
    Effectivement la normalité, n'est pas une condition nécessaire quant ton échantillon est assez grand (n>30), par contre l’homogénéité de la variance entre les deux échantillons doit être vérifiée, i.e est ce que la différence de variance entre tes echantillons est significatice ou pas.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Fonction R:bartlett.test(var.quantitative, var.factorielle)
    Si le test de Bartlett est non-significatice (on ne rejette pas H0), tu pourra faire un t-test si n>30.
    Sinon, tu as une version non-parametrique du t-test tu pourra regarder les tests de Wilcoxon ou de Mann_Withney.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    Fonction R: wilcox.test()
    Exemple:
    x <- c(1.83,  0.50,  1.62,  2.48, 1.68, 1.88, 1.55, 3.06, 1.30)
    y <- c(0.878, 0.647, 0.598, 2.05, 1.06, 1.29, 1.06, 3.14, 1.29)
    wilcox.test(x, y, paired = TRUE, alternative = "greater")
    wilcox.test(y - x, alternative = "less")    # The same.
    wilcox.test(y - x, alternative = "less",exact = FALSE, correct = FALSE)
    BC

  8. #8
    Nouveau membre du Club
    Profil pro
    Inscrit en
    mars 2012
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : mars 2012
    Messages : 69
    Points : 38
    Points
    38
    Par défaut
    En effet comme le dit Sengar, je ne modélise rien ici. Je ne compare pas non plus 2 échantillons. Il s'agit d'un test de student pour un échantillon. Donc pas besoin de vérifier l'homoscédasticité.

    Mes échantillons sont > 30 donc la violation de l'hypothèse de normalité ne m'empêche pas de procéder au test.

    Tout cela est plutôt positif car je dispose de valeurs identiques dans mon jeu de données ("ties") ce qui pose problème pour des tests tels que wilcoxon qui travaillent sur les rangs.

    Autrement, une dernière question. En pièce jointe vous pourrez trouver le plot de mes données en fonction du réplicat correspondant. Je dispose de 6 réplicat pour chaque condition d'expérimentation (2 conditions différentes au total). Je souhaitais vérifier l'indépendance de mes données. Or comme vous pouvez le voir, autant il n'y a pas de pb sur la pièce jointe nommée "25", autant sur celle nommée 37 on observe une tendance sur les derniers réplicats. ça n'est p-e pas suffisamment marqué pour que cela pose pb mais j'aurais voulu avoir votre avis sur la question.

    Merci à vous pour votre appui!
    Images attachées Images attachées   

Discussions similaires

  1. Débat : quelle distribution Linux choisir pour débuter ?
    Par Anonymous dans le forum Distributions
    Réponses: 227
    Dernier message: 18/02/2015, 10h09
  2. Réponses: 0
    Dernier message: 07/08/2009, 12h59
  3. Distribution spécialisée apache ?
    Par FRANCKYIV dans le forum Développement
    Réponses: 5
    Dernier message: 23/10/2003, 15h46
  4. Réponses: 2
    Dernier message: 22/09/2003, 12h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo