Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 06/05/2011, 12h23   #1
Candidat au titre de Membre du Club
 
Inscription : novembre 2010
Messages : 28
Détails du profil
Informations forums :
Inscription : novembre 2010
Messages : 28
Points : 11
Points : 11
Par défaut Proc logistic et valeurs manquantes

Bonjour,

Je fais une proc logistic sur une table avec plusieurs variables explicatives dont quelques unes ont des valeurs manquantes.

J'ai lu dans la doc online SAS (version 8) que les enregistrements avec valeurs manquantes sont automatiquement exclus de l'analyse (*) .

Pourtant mes valeurs manquantes apparaissent comme des modalites dans l'output de ma proc. Un beta est calcule pour la dummy variable qui leur correspond.

Est ce normal ? Comment puis je effectivement eviter d'avoir mes valeurs manquantes prises en comptes dans l'analyse (je ne veux pas mettre en input une table ou elles sont deja elimines parce que si j'utilise l'option stepwise ou tout autre procedure iterative d'inclusion/exclusion des variables dans le modele je veux pouvoir garder le maximum d'enregistrements pour les variables qui n'ont pas de valeurs manquantes...)

Merci bp !

(*)
Citation:
"
Any observation with missing values for the response, offset, or explanatory variables
is excluded from the analysis. The estimated linear predictor and its standard error
estimate, the fitted probabilities and confidence limits, and the regression diagnostic
statistics are not computed for any observation with missing offset or explanatory
variable values. However, if only the response value is missing, the linear predictor,
its standard error, the fitted individual and cumulative probabilities, and confidence
limits for the cumulative probabilities can be computed and output to a data set using
the OUTPUT statement."
dachboden est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/05/2011, 12h43   #2
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Je constate que les valeurs manquantes n'ont pas été estimées.

Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
DATA test;
input x y;
cards;
10 1
58 1
36 0
.  1
87 0
46 0
.  1
.  0
38 0
;
run;
 
proc logistic DATA=test outest=bb ;
model y=x;
output out=pred p=phat lower=lcl upper=ucl;
run;
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/05/2011, 13h36   #3
Candidat au titre de Membre du Club
 
Inscription : novembre 2010
Messages : 28
Détails du profil
Informations forums :
Inscription : novembre 2010
Messages : 28
Points : 11
Points : 11
Effectivement,
Vous avez raison.
J'ai confondu dans ma table input la categorie '.' avec la categorie valeur manquante...
Il ne s'agissait donc pas de vraies valeurs manquantes...
Merci pour votre reponse.
Tout s'explique
dachboden est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/05/2011, 13h55   #4
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Si t'es pas convaincu, tu peux rajouter une clause where afin d'éviter de modifier ta table

Code :
1
2
3
4
5
proc logistic DATA=test outest=bb ;
model y=x;
output out=pred p=phat lower=lcl upper=ucl;
WHERE x ne .;
run;
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 09h08.


 
 
 
 
Partenaires

Hébergement Web