Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 26/07/2011, 11h21   #1
Invité de passage
 
Inscription : juillet 2011
Messages : 8
Détails du profil
Informations forums :
Inscription : juillet 2011
Messages : 8
Points : 3
Points : 3
Par défaut modele probit et variables à plusieurs modalités

Bonjour,
je souhaite faire une estimation d'une variable à expliquée qualitative binaire (rad) à l'aide de variables quantitatives et qualitatives (avec 2 modalités ou plus).
J'ai choisi la procédure logit de SAS avec un lien probit. Est ce une bonne solution ?
Concernant les variables qualitatives faut il les mettre sous forme d'indicatrice avec une variable de référence ou toutes les mettre en les nommant dans la ligne class ? (je n'avais jamais eu à faire à des variables qualitatives à plus de 2 modalités auparavant donc je cherche le moyen d'interprétation le plus simple).
J'ai essayé les deux mais l'estimation en trouve que très peu de rad=1 par rapport à la réalité. D'où une question supplémentaire : comment traiter les variables endogènes ici ?
Merci de vos réponses !
Bonne journée !
sushi23 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 26/07/2011, 15h47   #2
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 823
Points : 2 823
Bonjour.
Le lien probit ne simplifie pas le commentaire du modèle et ne s'applique que dans certains types très particuliers d'études économétriques. Le lien logit est le plus couramment utilisé et les coefficients se commentent sous forme d'odds-ratios assez faciles à comprendre.
Pour les variables quali à plusieurs modalités, tu peux au choix créer toi-même les indicatrices ou laisser SAS les créer (à la fin de l'instruction CLASS, bien penser à / PARAM=REF ou PARAM=GLM). Le résultat est numériquement identique mais :
* avec les indicatrices tu n'auras pas d'intérêt global de ta variable (dans le tableau des tests de type 3)
* avec l'instruction CLASS ton commentaire sera associé à la modalité de référence (la dernière par ordre alphabétique par défaut), sauf si tu passes par d'autres chemins (proc Genmod et LSMEANS / DIFF=ALL dont tu récupères les sorties pour calculer des exponentielles, ou moins chiant, en SAS 9.2 via l'instruction ODDSRATIO / DIFF=ALL de la proc Logistic).

Quant à tes soucis de prédiction, je pense qu'ils viennent d'une très faible proportion de RAD=1 dans tes données, non ? Peut-être faudrait-il ne travailler qu'avec un échantillon de RAD=0 et avec tous les RAD=1 pour ramener la proportion entre 0 et 1 à quelque chose de plus équilibré (idéalement 50/50 mais ça fonctionne bien dès 80/20).

Bon courage.
Olivier
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/07/2011, 15h19   #3
Invité de passage
 
Inscription : juillet 2011
Messages : 8
Détails du profil
Informations forums :
Inscription : juillet 2011
Messages : 8
Points : 3
Points : 3
Merci beaucoup pour l'aide précieuse !
J'ai effectué un tirage aléatoire sur les rad=0 pour n'en garder d'un quart.
du coup j'ai un taux de concordance de prés de 69% j'espère que c'est assez!?
sinon j'ai réussi à calculer un score sur un nouvelle table cependant je me demande si la méthode prend en compte ou non les modalités non significatives? Car certaines modalités prennent trop de poids dans le calcul de la probabilité alors qu'elles ne sont pas significatives.
Merci d'avance.
A.P
sushi23 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h37.


 
 
 
 
Partenaires

Hébergement Web