|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||||
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
Bonjour,
J'aimerais avoir la p-value pondérée d'une anova, j'ai lancé ce programme : Code :
Code :
Est ce que la p-value pondérée dans la proc glm est toujours juste par contre ? Merci beaucoup pour vos réponses, |
||||
|
|
00
|
|
|
#2 | ||
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
en lancant ce code
Code :
|
||
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
En fait c'est au niveau de l'ecart type que ce n'est pas exactement le même pour une catégorie de la variable groupe car le dénominateur n'est pas corrigé je pense
|
|
|
00
|
|
|
#4 | ||
|
Invité de passage
![]() Inscription : septembre 2010 Messages : 2 ![]() |
Bonjour à tous,
j'ai la même interrogation que skywash58. La p-value par l'intermediare de la proc glm en pondérant mes données par l'option weight ne doit pas être calculée sur la bonne variance (anova). En effet si l'on utlise la proc means avec comme options vardef=WEIGHT et que l'on compare les résultats de la proc glm en mettant l'option weight on obtient la même valeur pour la moyenne mais pas la même valeur pour la variance. On obtient les même variance seulement si on ne met pas vardef=weight dans la proc means. (voir les procedure utilisée ci-dessous) Je dois calculer un p-value par une anova, soit une analyse de la variance. Si la variance n'est pas la même ma p-value ne sera par conséquent pas la même. Ma question: Est ce que quelqu'un connait une option dans la proc glm permettant de calculer la p-value en fonction des poids. Voila les procedures utilisées qui ne donnent pas la même variance. Code :
Si cela n'est pas clair je rééxplique. |
||
|
|
00
|
|
|
#5 | |||||
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
Bonjour Boucheen,
J'ai un peu plus de temps pour me pencher sur le probleme aujourd'hui et voici ce que j'en pense: On va commencer par la proc means. En regardant http://www.sfu.ca/sasdoc/sashtml/proc/zormulas.htm et http://www.sfu.ca/sasdoc/sashtml/proc/zrweight.htm il existe plusieurs methodes proposees par sas pour calculer la deviation standard. La plus utilisee est sans aucun doute vardef=df (le defaut, soit dit en passant), qui correspond a une estimation non biaisee de la variance de la population sous-jacente (si cette variance existe et que les chantillons sont determines independamment et avec remplacement). En faisant une analyse ponderee, tu trouveras donc les meme resultats avec cette pour la proc means avec vardef=df et la proc glm, si la repartition de tes poids est identique pour chacune de tes categories de ton by: Code :
Maintenant je te propose un cas assez particulier. En generant les poids d'une maniere aleatoire, on provoque une repartition differente des poids pour chacune des categories, et dans ce cas, l'analyse de la glm ne retombe sur aucun des resultats de la proc means. Code :
Citation:
Manoutz |
|||||
|
|
00
|
|
|
#6 | |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
http://support.sas.com/documentation...lm_sect018.htm
Citation:
PROC MEANS calcule une variance separement pour chaque categorie de ton by, basee une nombre de degres de liberte inferieur. |
|
|
|
00
|
|
|
#7 |
|
Invité de passage
![]() Inscription : septembre 2010 Messages : 2 ![]() |
Merci Manoutz pour cette réponse précise.
Cela a pu m'éclairer et je pense résoudre mon probleme. En fait mes poids entre les groupes etaient totalement déséquilibrés: 975(groupe 1) vs 1 800 000(groupe 2). Ce qui me donnait une variance enorme pour le groupe 2. Le résultat de la p-value grace à l'anova (qui se base sur la variance) etait donc systématiquement non significatif. J'ai donc 'standardisé' mes poids pour se baser sur une comparaison de groupe homogène. Bonne journée à tous. |
|
|
00
|
|
|
#8 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
Une autre possibilite pour gerer l'heteroscedasticite consiste a utiliser la proc mixed qui permet de travailler avec variances inegales.
En utilisant le group= dans un statement repeted sans variable, on aura une estimation des residues propre a chaque categorie. C'est assez puissant, et en plus on a le test du maximum de vraisemblance genere automatiquement qui permet de se prononcer directement sur l'homoscedasticite |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com