|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Inscription : juillet 2011 Messages : 8 ![]() |
Bonjour,
je souhaite faire une estimation d'une variable à expliquée qualitative binaire (rad) à l'aide de variables quantitatives et qualitatives (avec 2 modalités ou plus). J'ai choisi la procédure logit de SAS avec un lien probit. Est ce une bonne solution ? Concernant les variables qualitatives faut il les mettre sous forme d'indicatrice avec une variable de référence ou toutes les mettre en les nommant dans la ligne class ? (je n'avais jamais eu à faire à des variables qualitatives à plus de 2 modalités auparavant donc je cherche le moyen d'interprétation le plus simple). J'ai essayé les deux mais l'estimation en trouve que très peu de rad=1 par rapport à la réalité. D'où une question supplémentaire : comment traiter les variables endogènes ici ? Merci de vos réponses ! Bonne journée ! |
|
|
00
|
|
|
#2 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Bonjour.
Le lien probit ne simplifie pas le commentaire du modèle et ne s'applique que dans certains types très particuliers d'études économétriques. Le lien logit est le plus couramment utilisé et les coefficients se commentent sous forme d'odds-ratios assez faciles à comprendre. Pour les variables quali à plusieurs modalités, tu peux au choix créer toi-même les indicatrices ou laisser SAS les créer (à la fin de l'instruction CLASS, bien penser à / PARAM=REF ou PARAM=GLM). Le résultat est numériquement identique mais : * avec les indicatrices tu n'auras pas d'intérêt global de ta variable (dans le tableau des tests de type 3) * avec l'instruction CLASS ton commentaire sera associé à la modalité de référence (la dernière par ordre alphabétique par défaut), sauf si tu passes par d'autres chemins (proc Genmod et LSMEANS / DIFF=ALL dont tu récupères les sorties pour calculer des exponentielles, ou moins chiant, en SAS 9.2 via l'instruction ODDSRATIO / DIFF=ALL de la proc Logistic). Quant à tes soucis de prédiction, je pense qu'ils viennent d'une très faible proportion de RAD=1 dans tes données, non ? Peut-être faudrait-il ne travailler qu'avec un échantillon de RAD=0 et avec tous les RAD=1 pour ramener la proportion entre 0 et 1 à quelque chose de plus équilibré (idéalement 50/50 mais ça fonctionne bien dès 80/20). Bon courage. Olivier |
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : juillet 2011 Messages : 8 ![]() |
Merci beaucoup pour l'aide précieuse !
J'ai effectué un tirage aléatoire sur les rad=0 pour n'en garder d'un quart. du coup j'ai un taux de concordance de prés de 69% j'espère que c'est assez!? sinon j'ai réussi à calculer un score sur un nouvelle table cependant je me demande si la méthode prend en compte ou non les modalités non significatives? Car certaines modalités prennent trop de poids dans le calcul de la probabilité alors qu'elles ne sont pas significatives. Merci d'avance. A.P |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com