|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Membre habitué
![]() Inscription : janvier 2005 Messages : 527 ![]() |
Bonjour,
Je viens sur ce forum une nouvelle fois pour vous demander de l'aide ![]() Je dois réaliser un modèle de régression: - la variable à expliquer est le paramètre A - les variables explicatives sont les paramètres B, C, D et E - les paramètres D et E sont (très?) corrélés - les paramètres A, D et E sont des données répétées sur chaque sujet (il s'agit de la mesure ECG, température, fréquence cardiaque) - le paramètre B est fixe (age du sujet) - le paramètre C est fixe (groupe de traitement) Je voulais donc partir sur une proc mixed avec un modèle du type: A = B + C + D + E + D*E Mon problème est que je ne connais pas bien toutes les options utiles de la syntaxe sas. Le but final est de: 1. savoir si les paramètres B, C, D et E ont une influence sur le paramètre A 2. faire un graphique pour le représenter Code :
Je vous remercie de m'éclairer. |
||
|
|
00
|
|
|
#2 | ||
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Bonjour Debdev.
Commençons par la syntaxe, parce que pour l'interprétation des résultats, ce serait un tutoriel de plusieurs pages selon le degré de finesse que tu souhaites. (Pour info il y a un plutôt bon livre "The SAS System for Mixed Models", même s'il date un peu, il contient l'essentiel.)
Code :
Pour l'option TYPE (la forme de la matrice de covariance) les choix les plus courants sont UN (inconnu), CS (constante), TOEP (constante par bandes), AR (auto-régressive) ; la dernière suppose des mesures répétées à intervalles réguliers, attention ! Bon courage. Olivier |
||
|
|
20
|
|
|
#3 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
Bonjour Debdev,
A mon tour de donner ma version, qui d'ailleurs se rapproche pas mal de celle d'Olivier.
J'ouvre également le débat sur la nécessite de la normalité de A avant d'appliquer une proc mixed. C'est rarement contrôlé mais je pense que c'est mieux. C'est d'ailleurs indiqué dans l'aide en ligne sas en introduction de la proc mixed. Ah oui, une dernière chose: tu veux savoir si les paramètres B, C, D et E ont une influence sur le paramètre A. Je suppose que tu veux savoir l'influence de chaque paramètre indépendamment des autres, c'est bien ca? Manoutz |
|
|
20
|
|
|
#4 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Manoutz, c'est toujours un plaisir de tomber d'accord avec toi.
Au titre des vérifications indispensables mais souvent zappées :
|
|
|
00
|
|
|
#5 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
C'est la ou ca peut se discuter, justement. La théorie demande quatre conditions pour validité d'une régression linéaire:
Mais pas la normalité de la distribution de la variable dépendante. SAS le pose en prérequis de la proc mixed et je me demande pourquoi cette condition "supplémentaire". Bon je sais, c'est un peu chipoter, mais je serais curieux de savoir ce qui se passe derrière le rideau... |
|
|
00
|
|
|
#6 | |
|
Membre habitué
![]() Inscription : janvier 2005 Messages : 527 ![]() |
Merci tous les 2 ! Vous répondez toujours présents, c'est très sympa de votre part.
Alors, j'ai proposé le modèle comme indiqué par Olivier. Mais on m'a dit après coup que l'on n'utilisait pas toutes les valeurs de T°C et fréquences cardiaques mais seulement le max pour la fréquence cardiaque et la valeur à baseline pour la T°C (ne me demandez pas pourquoi, ça a été décidé par des médecins => j'applique Concernant les variables class, oui dsl Citation:
Je n'ai pas encore bien interprété les résultats mais en tous les cas je vous remercie grandement tous les 2 pour l'aide que vous m'apportez, ainsi que pour vos explications toujours claires. Bonne fin de journée |
|
|
|
00
|
|
|
#7 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
@ Manoutz :
Mais la normalité des Y (enfin de A ici) n'est-elle pas la même que celle des résidus ? [Attention aux âmes sensibles, il va y avoir quelques formules.] On modélise : E(A|B,C,D,E) = cste + combinaison_linéaire_de_B,C,D,E Si cette modélisation est correcte (sans biais) alors on a aussi : A = cste + combinaison_linéaire_de_B,C,D,E + résidu Qu'est-ce qui est aléatoire là-dedans ? A l'est, le résidu l'est, B et les autres facteurs explicatifs sont fixes donc non aléatoires. Les coefficients du modèle sont des réalisations de variables aléatoires mais pas aléatoires eux-mêmes. Donc la loi de A est la loi du résidu, à un centrage près. J'ai bon là ? (Vous avez le droit de penser le contraire.) |
|
|
00
|
|
|
#8 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
Je ne suis pas conscient de tous les enjeux de ton problème, mais ca ne risque pas de poser un problème si max de la fréquence cardiaque correspond à différents moments de mesures suivant le patient? Question à rattacher avec l'objectif de l'étude..
p=0.503. Le tir n'est pas passé loin! J'aurais pour ma part comparé deux modèles, un global avec interaction, un sans pour examiner la différence par l'intermédiare de la méthode citée plus haut. @ Olivier: ton raisonnement à l'air juste. Ca répond en partie à ma question. mais en conséquence, pourquoi ne pas regarder les résidus comme le soutient la théorie? |
|
|
00
|
|
|
#9 | |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Citation:
C'est d'ailleurs ce qui arrive quand on modélise une variable qui n'est pas exactement normale, un peu asymétrique, et qu'arrivé en fin d'analyse, on regarde les résultats et on découvre un effet trompette. Damned ! on a fait notre analyse pour rien !!! Quant à savoir pourquoi la théorie s'acharne sur les résidus, n'est-ce pas en raison de leur centrage ? Ca permet de mieux prévoir leurs valeurs, surtout après studentisation, où les valeurs atypiques sortent clairement du lot. Dans les modèles linéraires généralisés (proc GENMOD et GLIMMIX), on vérifie les distributions en amont (sur Y) et en aval (sur les résidus). Preuve qu'un modèle mal spécifié peut avoir une influence... |
|
|
|
00
|
|
|
#10 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
Surement un des cas ou la pragmatique Pratique devance la Théorie puriste. Merci Olivier
|
|
|
00
|
|
|
#11 | |
|
Membre habitué
![]() Inscription : janvier 2005 Messages : 527 ![]() |
Citation:
Quoiqu'il en soit, le modèle a été proposé et il est maintenant en discussion. Je serai peut être amenée à vous recontacter mais d'ici là je vous remercie pour votre aide et vous souhaite une bonne journée |
|
|
|
00
|
|
|
#12 | |
|
Futur Membre du Club
![]() Étudiant Inscription : juin 2011 Messages : 19 ![]() |
Bonjour,
Je viens de tomber sur ce post que je trouve très intéressant et je voulais savoir si je pouvais avoir quelques informations supplémentaires. Citation:
En vous remerciant d'avance, Magali |
|
|
|
00
|
|
|
#13 |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 143 ![]() |
ici:
Verbeke G. and Molenberghs G. (2000) `Linear mixed models for longitudinal data,' Springer Series in Statistics, Springer-Verlag, New-York, 568 pages. ISBN 0-387-95027-3 (hard cover), first printing in 2000, second printing in 2001. ISBN 978-1-4419-0299-3 (paper back), third printing in 2009. |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com