Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 21/02/2011, 17h37   #1
Invité de passage
 
Inscription : janvier 2011
Messages : 10
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 10
Points : 3
Points : 3
Par défaut Proc logistic : calcul des effets marginaux

Bonjour,

J'ai réalisé une régression logistique polytomique ordonnée sur SAS à partir de la PROC LOGISTIC.

En fait, j'ai deux questions :
1. Le test de l'égalité des pentes. Selon mes sources d'informations, le sens donné au test n'est pas le même... Pour que les pentes soient considérées égales, le test doit-il être significatif sur SAS ou pas? (d'après moi, non... mais je commence à en douter...). Le sauriez-vous?

2. Dans le tableau qui présentera les résultats trouvés, je souhaite insérer les betas et les résultats des tests de significativité. On m'a conseillé de rajouter les effets marginaux (moyens).
Le problème : je ne sais pas comment m'y prendre. Existe-t-il un moyen de calculer les effets marginaux par individu à travers la PROC LOGISTIC (à partir d'un OUTPUT OUT) puis passer par une PROC MEANS? Ou une autre solution?
A moins que le calcul des effets marginaux soient au final une mauvaise idée...

En vous remerciant par avance de vos réponses,
Claudine
Felizzy est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/02/2011, 18h52   #2
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 823
Points : 2 823
Bonjour.
Test d'égalité des pentes : H0 = les pentes sont égales. Donc p-value élevée = hypothèse non rejetée et régression polytomique ordonnée valable. Sinon, l'ordre des modalités ne peut être exploité pour simplifier le modèle.
Attention, comme toujours avec les tests, de forts effectifs font baisser mécaniquement les p-values. On peut donc considérer en général avec p>0.15 qu'on a égalité des pentes et un modèle crédible.

"Effets marginaux" : je ne sais pas bien de quoi on parle. Mais au hasard, avec les éléments que tu fournis, je pencherais pour des LSMEANS dans la proc GENMOD.

Bon courage.
Olivier

PS : ce topic aurait été plus à sa place dans le forum SAS/STAT que dans SAS/BASE.
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 20
Vieux 22/02/2011, 09h30   #3
Invité de passage
 
Inscription : janvier 2011
Messages : 10
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 10
Points : 3
Points : 3
Bonjour,
Merci pour votre réponse.

1. Pour le test de l'égalité des pentes. Je travaille sur un échantillon de 5337 personnes. Ma p-value est proche de 0 ; donc je rejette H0. Mes craintes sont donc fondées ; ma variable-réponse n'est pas considérée comme étant ordonnée.
En fait, cela me questionne un peu car à la base, ma variable-réponse est une variable quantitative (nb de déplacements) que j'ai transformée en variable qualitative (type de voyageurs selon le nb de déplacements => 5 classes de "non partant" à "très grand voyageur"). Donc je n'arrive pas à saisir pourquoi H0 est rejetée.
Du coup, je vais essayer une régression de poisson (en travaillant donc à partir de ma variable initiale : le nb de déplacements) ou sinon opter pour une régression logistique pour variable réponse nominale.

2. Concernant les effets marginaux. Il ne s'agit que de pouvoir quantifier comment les variables explicatives affectent la variable-réponse. Je n'ai pas encore essayé ce que vous m'avez indiqué. A faire...

En tout cas merci pour les détails donnés,
Claudine
Felizzy est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/02/2011, 10h46   #4
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Bonjour,
SAS fournit en sortie les odds-ratio qui represente l'effet de variation des variables explicatives sur la réponse.
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/02/2011, 12h29   #5
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 143
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 143
Points : 1 760
Points : 1 760
Je pencherais en effet vers une régression de poisson qui convient bien pour modéliser une variable de comptage (idéalement, les comptages doivent être faible).

La proc genmod convient très bien à ce contexte.
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 22/02/2011, 14h03   #6
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 823
Points : 2 823
Attention Claudine.
Si l'hypothèse des pentes proportionnelles est rejetée, ça ne veut pas dire que la variable Y n'est pas considérée comme ordonnée. Ca veut juste dire qu'on ne peut pas utiliser son ordre comme un facteur de simplification du modèle, parce qu'au moins une des variables explicatives du modèle a une influence différente selon le niveau considéré.
La volumétrie peut expliquer une partie de la p-value. La complexité du modèle est une autre source de soucis : plus il y a de coefficients dans le modèle, plus H0 est une hypothèse lourde et difficile à satisfaire. Idem avec le nombre de niveaux de Y.

Alternatives : modéliser Y comme non ordinale, regrouper les niveaux de Y, simplifier le modèle, ou modéliser Y comme un comptage sans faire de tranches, comme le suggère Manoutz.
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 22/02/2011, 14h30   #7
Invité de passage
 
Inscription : janvier 2011
Messages : 10
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 10
Points : 3
Points : 3
Effectivement, les variables explicatives que j'intègre dans le modèle sont nombreuses : quelques variables socio-démographiques auxquelles je rajoute des variables concernant le lieu de résidence et des variables comportementales. Je vais simplifier le modèle (surtout que certaines variables sont corrélées entre elles). Je trouve l'arbitrage difficile entre un modèle complet, le nb de variables, l'ajustement...

Je vais, finalement, faire à la fois une régression logistique en simplifiant le modèle et une régression de poisson. Cela me permettra de comparer les résultats.

... je comprends mieux pourquoi lorsque je lançais la PROC LOGISTIC avec l'option FORWARD, au fur et à mesure, que la procédure progressait incluant de nouvelles variables, la p-value se rapprochait de 0. Merci Olivier!

En tout cas, merci pour vos réponses,
et bonne après-midi,
Claudine
Felizzy est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/02/2011, 15h17   #8
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 143
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 143
Points : 1 760
Points : 1 760
okay.

Pour info, de la doc sas sur la régression de poisson. Convient parfaitement pour les variable de comptage

http://beta.kalidao.com/clientzone/l...%20Poisson.pdf
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 24/02/2011, 08h20   #9
Invité de passage
 
Inscription : janvier 2011
Messages : 10
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 10
Points : 3
Points : 3
Merci pour le doc!
Felizzy est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 13h01.


 
 
 
 
Partenaires

Hébergement Web