|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
Bonjour,
Pour étudier l'évolution d'une variable Y dans le temps, j'ai effectué la procédure GLIMMIX suivante: Code :
L'estimation des constantes et pentes sont sensiblement les mêmes mais les p values concernant la variable pente varient comme dans le fichier ci-joint. A quoi sont dûes de telles différences ? Merci beaucoup pour vos réponses, |
||
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
Je ne suis pas un expert de la proc GLIMMIX, mais dans ton modele tu consideres la variable temps comme continue (une valeur chiffree si on peut dire, en simplifiant un peu). Il semble sense que si tu change sa valeur les resultats changent egalement.
|
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
C'est embêtant au niveau de la robustesse du modele dans la mesure où l'on ne peut pas mettre la variable en charactère.
La tendance de la droite doit être toujours la même or la p value associée à la pente est nettement différente lorsque l'on fait varier la variable temps : ce qui n'est pas logique non? |
|
|
00
|
|
|
#4 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
je ne pense que ce soit necessaire de passer ta variable au type caractere. il suffit de declarer ta variable dans le class pour qu'elle soit consideree comme categorielle...
Apres tu ne code plus la meme chose, evidemment. D'ailleurs, pourquoi modelises tu trois fois, avec differentes valeurs de temps? |
|
|
00
|
|
|
#5 | ||
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
J'ai bien pris nu en class :
Code :
Est ce normal ? |
||
|
|
00
|
|
|
#6 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
Je ne comprends pas bien ce que modelises ni ce que tu dis.
Peux tu reexpliquer? Que modelises tu et a quoi correspond ta variable nu? |
|
|
00
|
|
|
#7 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
En fait j'ai des données avec plusieurs lignes par centre et nu est la variable identifiant le centre,
Par ligne on a l'identifiant du centre : nu l'année : annee le nombre de lot : n le nombre de succés parmi ces lots : Y Exemple : nu annee n Y 1 2006 45 3 1 2007 64 1 1 2008 108 2 2 2006 26 0 2 2010 45 3 A partir de la variable annee je créé la variable time de la façon suivante : else if annee=2007 then time=1; else if annee=2008 then time=2; else if annee=2009 then time=3; else if annee=2010 then time=4;Le modèle utilisé est un modele généralisé mixte avec distribution binomiale : proc glimmix data=table; class nu; model Y/n = time /solution dist=binomial link=logit; random intercept time /type=AR(1) subject=nu g gcorr v vcorr; run;On prend pour effet aléatoire nu, le centre. On obtient ainsi l'estimation de la constante et de la pente de la droite. Or quand la variable temps (numérique) est en 0/1/2/3 je n'obtiens pas les mêmes résultats que lorsque elle est en 1/2/3/4 ou même en 2/3/4/5 : L'estimation des constantes et pentes sont sensiblement les mêmes mais les p values qui leur sont associées sont très différentes. Or il s'agit normalement de la même droite donc la p value correspondant à la pente de cette droite devrait être la même non ? |
|
|
00
|
|
|
#8 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
La constante varie et c'est normal puisque tu décales la droite en changeant les valeurs de temps. La pente, en revanche, devrait (en théorie) rester la même.
Ton modèle me semble assez "chargé" : un effet centre et un effet centre*année ? Tu as besoin des 2 ? |
|
|
00
|
|
|
#9 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
en fait constantes et pentes sont à la fois en fixe et aléatoire pour tenir compte de la variabilité inter centre et l'effet centre est en aléatoire, je ne peux pas moins charger ce modèle malheureusement, car c'est ce que je cherche à modéliser...
|
|
|
00
|
|
|
#10 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
essaye avec TIME dans ton class (cf mes precedants posts)
|
|
|
00
|
|
|
#11 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
D'accord avec le temps en variable quali il n'y aura plus de souci puisque le codage sera neutre, mais on perd l'idée d'une évolution continue des probas de l'évènement au fil des années.
En essayant de reproduire le problème, je n'ai pas de variation de pente, en revanche les standard errors et les p-values bougent un peu. |
|
|
00
|
|
|
#12 | |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
Citation:
|
|
|
|
00
|
|
|
#13 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
Oui j'ai essayé et effectivement là les résultats ne changent plus mais par contre on a des pentes devant chaque catégorie de la variable time et je ne comprends plus du coup la signification ?
Car time est une variable de temps et le fait de ne pas la prendre en numéric me gêne.... Merci beaucoup pour votre retour, |
|
|
00
|
|
|
#14 | |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Avec temps en variables quali, les coefficients ne représentent plus des pentes mais des écarts de moyennes (ici des log d'odds-ratios) par rapport à l'année de référence, la dernière. Ce n'est donc plus un schéma où les log-odds-ratios évoluent de manière linéaire avec l'année, mais de manière totalement libre et donc potentiellement non linéaire.
Citation:
Je soupçonne que c'est un coup des effets aléatoires. Skywash, peux-tu vérifier que les coefficients des pentes restent les mêmes avec tous les types de codages, si tu vires du modèle l'instruction RANDOM ? |
|
|
|
00
|
|
|
#15 | ||
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 20 ![]() |
Effectivement, lorsque j'applique le même modèle sans l'instruction random comme ci - dessous :
Code :
Résultats détaillé sur le fichier excel ci joint. Ce serait donc dû au fait de prendre le centre en aléatoire ainsi que la constante et pente ? Du coup au niveau de la robustesse du model y a t il une façon optimale de codage la variable time ? dans des exemples de sas elle peut être en 0/1/2 ou en 1/2/3.... Merci beaucoup, |
||
|
|
00
|
|
|
#16 | |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
Citation:
J'ai essaye de reproduire le probleme. Je pense avoir trouve de "bonnes" donnees pour gerer la convergence, mais j'ai un probleme avec mes templates de la glimmix que sas ne retrouve pas, donc je ne genere pas de sorties... Si qqn a une idee.. Dommage, j'aurais bien voulu continuer a creuser.. |
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com