|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | |
|
Invité de passage
![]() Étudiant Inscription : janvier 2012 Messages : 1 ![]() |
Bonjour,
Nous avons un projet de statistique à faire en SAS. Dans une des questions, nous devons ajuster le modèle à l'aide de la proc Genmod en enlevant les variables non significatives (p-valeur > 5%). Nous avons écrit: Citation:
Region : B ( DDL = 1, p-valeur = 0.1199) L ( DDL = 1, p-valeur = <.0001) MP ( DDL = 0, p-valeur = - ) Donc nous allons devoir enlever la variable B puis refaire une régression avec L et MP. Mais le ddl de MP est toujours 0 donc on ne sait pas si on ne comprend pas trop ce qu'il faut faire après. Et aussi, on ne comprend pas trop ce que ça veut dire ddl = 0. Merci pour votre réponse, Cordialement, |
|
|
|
00
|
|
|
#2 | ||||||||
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Bonjour.
Moi aussi j'ai une question : pourquoi une proc GENMOD ? Si c'est pour faire le modèle que tu décris, une proc GLM suffit (si DECOUV suit une loi normale). Bon, à part ça, le sort des variables qualitatives dans un modèle. Pour bien comprendre, on va commencer tout simple, avec la variable SEXE qui vaut F ou M. Code :
Code :
Ce choix est arbitraire. Si on codait la variable SEX autrement (2 pour filles et 1 pour les garçons), ce qu'on va montrer avec un format, on obtient un autre jeu de coefficients totalement équivalent au précédent. Code :
Code :
Vient ensuite la question de la significativité des coefficients. Le test de significativité (test de Wald dans la proc GENDMOD) a pour hypothèse nulle que le coefficient vaut zéro. Dans le cas d'une variable quantitative, ça veut dire qu'elle a une pente nulle, donc aucune influence linéaire sur Y. Dans le cas d'une modalité d'une variable qualitative, ça veut dire que l'écart avec la référence, en termes de moyennes de Y, est inexistant. Autrement dit, si on a un coefficient pour X=A non significatif, avec X=C comme référence, alors les moyennes de Y pour X=A et pour X=C sont tellement "proches" qu'elles sont statistiquement indiscernables. Dans ce cas, si un tel regroupement a un sens "métier", on peut fusionner les deux modalités A et C en une seule. Et refaire ensuite le modèle. Le risque c'est de sauter aux conclusions à la seule vue du tableau des coefficients : voir que A et C ne sont pas significativement différents, alors qu'en réalité, l'écart entre A et B est encore moins significatif (--> A et B devraient être fusionnés en priorité). Mais si C est la référence, rien dans le tableau de coefficients n'indique la significativité de l'écart entre A et B. Il faudrait choisir une de ces 2 modalités comme référence. Le plus simple dans ce cas est d'utiliser l'instruction LSMEANS et son option DIFF. On aura ainsi toutes les comparaisons 2 à 2 de modalités. On fusionne les deux dont la p-value sera la plus élevée, à condition que cette fusion ait un sens (par exemple, si ce sont des CSP, on ne fusionnera pas "cadres" et "ouvriers" car la nouvelle catégorie serait difficile à justifier). Et on refait le modèle, et ainsi de suite, jusqu'à ce que toutes les p-values soient, soit en-dessous du seuil choisi à l'avance (tu évoques 5%), soit associées à des couples non fusionnables. J'espère avoir répondu à tes interrogations. Bon courage. Olivier |
||||||||
|
|
00
|
|
|
#3 |
|
Futur Membre du Club
![]() Inscription : décembre 2009 Messages : 105 ![]() |
Bonjour phuphu,
D'abord comme dit olivier, je ne comprend pas pourquoi une proc GENMOD? Une proc GLM suffit tout simplement. De plus, je ne comprend pas vraiment votre question... Pouvez vous être un peu plus clair svp? En tout cas bonne chance ![]() Merci. |
|
|
11
|
|
|
#4 | |
|
Membre Expert
![]() Biostatisticien Inscription : juin 2009 Messages : 1 150 ![]() |
Bonjour, je rejoins les commentaires de bsangoku.
Merci de nous preciser quel est l'objectif escompte. En fonction de cela il y aura peut etre moyen de t'aider sur le choix de la syntaxe, et t'aider a la comprehension de to sortie sas. Citation:
|
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com