Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 10/02/2011, 09h28   #1
Invité de passage
 
Inscription : janvier 2011
Messages : 12
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 12
Points : 3
Points : 3
Par défaut ACM : Traitement des données manquantes

Bonjour à tous,

je cherche à réaliser des typologies d'individus sur la base d'une enquête avec SAS; la plupart des réponses sont qualitatives. Je réalise donc une ACM (proc corresp) suivi d'une CAH (proc cluster et proc tree).
Mon problème est qu'il existe de nombreuses réponses manquantes. J'ai décidé de mettre en variable supplémentaire les modalités correspondantes aux questions manquantes :
par ex si pour la question 1 il y a trois modalités possibles je conserve dans l'analyse la modalité a, la b et la modalité NR sera mise en supplémentary => ceci aboutit à ce que certains individus n'est pas de réponses à une questions donnée mais j'arrive tout de même à les faire figurer sur les axes factoriels.
Est ce que cela a un sens ? Comment traitez vous les réponses manquantes ?

Merci de votre aide.
emart est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/02/2011, 10h00   #2
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Bonjour,
Il serait intéressant de les inclure dans la constitution de tes axes factoriels et de regarder si tu conserves la même interprétation que précédemment.
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/02/2011, 10h13   #3
Invité de passage
 
Inscription : janvier 2011
Messages : 12
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 12
Points : 3
Points : 3
Si je laisse ces modalités NR, du fait de leur faible effectif, cela tire les deux premiers axes; (la contributions aux deux premiers axes est expliqué que par ces Non réponses) : ce qui fausse l'analyse.
emart est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/02/2011, 10h26   #4
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
je serais du même avis que toi à les mettre en individus supplémentaires, vu que ça fausse les interprétations.
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/02/2011, 10h32   #5
Invité de passage
 
Inscription : janvier 2011
Messages : 12
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 12
Points : 3
Points : 3
Merci de ton soutien,

pour aller un peu plus loin dans la réflexion, il existe biensur d'autres possibilités comme regrouper les NR avec une autre modalité ou encore imputer les NR avant de faire l'analyse.... mais cela me semble périlleux.

Je peux aussi supprimer les individus avec NR ! mais après tout la présence de NR est le reflet d'un comportement particulier et donc doit être pris en compte !!!!

et le fait de supprimer ces individus créé un nouveau problème : cela me fait du coup 50% d'individus en plus à reclasser avec les risques d'erreurs que cela comporte.

Eric.
emart est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/02/2011, 10h50   #6
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Tu peux remplacer les NR par la moyenne de la variable concernée mais à conditions que tes variables soient continues bien sûr.

L'imputation des valeurs manquantes pur et dur implique que ton analyse sera propre à tes données (n'incluant pas des valeurs manquantes) alors que c'est pas la réalité. Il y a bien des personnes qui ne répondent pas aux enquêtes comme moi et ne facilite pas le travail des gens comme toi!!

Bon courage!
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/04/2011, 16h16   #7
Membre habitué
 
Inscription : décembre 2009
Messages : 21
Détails du profil
Informations forums :
Inscription : décembre 2009
Messages : 21
Points : 114
Points : 114
Citation:
Envoyé par emart Voir le message
Merci de ton soutien,

pour aller un peu plus loin dans la réflexion, il existe biensur d'autres possibilités comme regrouper les NR avec une autre modalité ou encore imputer les NR avant de faire l'analyse.... mais cela me semble périlleux.

Je peux aussi supprimer les individus avec NR ! mais après tout la présence de NR est le reflet d'un comportement particulier et donc doit être pris en compte !!!!

et le fait de supprimer ces individus créé un nouveau problème : cela me fait du coup 50% d'individus en plus à reclasser avec les risques d'erreurs que cela comporte.

Eric.
Bonjour,

je ne sais pas si la question est toujours d'actualité, mais si tu réalises une typologie et que tu imputes les données manquantes, tu risques de fausser considérablement les résultats (en fait de créer artificiellement les classes) compte tenu des méthodes d'imputation!! Même chose avec la moyenne des valeurs (d'autant plus que la moyenne d'une variable qualitative a un sens plus que douteux).

A mon sens,il faut tenir compte de plusieurs paramètres:
1. Est-ce que les modalités manquantes sont présentes en proportions importantes par rapport aux autres modalités de la variable? Si oui, ouille. Si non, tu peux ventiler ces données manquantes (mais tu risques aussi de ventiler les modalités de faible effectif, qui après tout tireront aussi les axes simplement du fait de leur effectif!)
2. Est-ce que tu ne peux pas supprimer des individus ayant beaucoup de non-réponse? S'il y en a peu par rapport à ton echantillon total, c'est envisageable (mais tu perds tout de même de l'info : les profils de non-répondants peuvent être particulier, cf tes variables illustratives)

Il me semble que l'ACM sur données incomplètes peut résoudre ce problème, mais tes axes seront tirés artificiellement par les modalités rares (à moins que tu n'en ai pas d'autres?)

A bientôt,

T.
tarlito est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/06/2011, 18h15   #8
Invité de passage
 
Inscription : janvier 2011
Messages : 12
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 12
Points : 3
Points : 3
merci de ta réponse.

J'ai finalement opté par mettre les données manquantes dans des var spécifiques puis je mets ces nouvelles var en illustratives.
emart est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 11h39.


 
 
 
 
Partenaires

Hébergement Web