|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Membre habitué
![]() Julien Ingénieur d'études / Biostatisticien Inscription : décembre 2009 Messages : 304 ![]() |
Bonjour, dans le cadre de régression logistique sur variables continues, je cherche à vérifier l'hypothèse de log-linéarité de chaque variable permettant de valider la fiabilité des résultats obtenus par la régression.
J'ai regardé sur google et niet, quelqu'un sait si on peut vérifier automatiquement cette hypothèse sous SAS? En vous remerciant d'avance. |
|
|
00
|
|
|
#2 |
![]() ![]() Stéphane Consultant et formateur SAS et Cognos Inscription : avril 2009 Messages : 1 791 ![]() |
tu veux vérifier chaque variable explicative ? pourquoi ?
la transformation en loglin permet d'assurer une meilleure régression de variables (Y) qui sont 'décalées' à gauche comme les salaires. Qu'est ce qui t'amène à un tel test ?
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !Moteur de recherche dans les papiers SAS |
|
00
|
|
|
#3 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
En fait tu veux vérifier que chaque variable quanti a un lien linéaire avec LOG(p/1-p) ? C'est ce que je suppose du contexte (régression logistique).
Pour faire ça, il n'y a probablement rien d'automatique sous SAS. En particulier parce que l'adéquation à la forme linéaire est assez subjective ; au mieux tu peux utiliser la proc REG et voir ce qu'elle te donne comme R², ou mettre ta variable quanti en tranches (automatiquement ?) et comparer le modèle logistique avec la variable quanti telle quelle et celle en tranches (en comparant les critères de Schwartz en particulier pour que la comparaison soit honnête, parce qu'en termes de vraisemblance tu auras quasiment à tous les coups un avantage pour la version en tranches). Si les graphiques permettant de juger de l'adéquation t'intéressent, j'ai mis en ligne une macro ici. Elle prend en entrée TOUTES les variables d'une table pour les croiser avec Y : il est donc préférable de créer une table temporaire avec seulement les variables X à représenter. Code :
%linkGraph (TABLE, variableY, event = 1, round=yes) ; Olivier |
|
|
10
|
|
|
#4 |
|
Membre habitué
![]() Julien Ingénieur d'études / Biostatisticien Inscription : décembre 2009 Messages : 304 ![]() |
Pour répondre à Datametric, je ne suis pas trés à l'aise avec cette hypothèse étant donné qu'à une époque j'avais cherché pas mal d'infos dessus et je n'ai rien trouvé ou plutot que des trucs littérals/littéraux (j'ai honte...) du genre: log-linéarité = quelque soit le point de la pente on observe le degré = l'odd ratio ne change pas quelque soit le segment que l'on regarde, et des rapprochements avec la normalisation, ce que je peux concevoir en effet avec la comparaison sur les qqplot.
Tout ce que je sais c'est que l'on peut dire que les résultats d'une régression logistique sur variables continues est fiable uniquement si chaque variable respecte cette hypothèse... aprés... justement n'ayant pas trouvé beaucoup d'infos j'avoue être un peu limité. Concernant tes conseils Olivier, je te remercie, ça m'offre des points sur lesquels creuser! Merci à tous les deux pour votre intérêt à mon topic et vos conseils. |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com