|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 12 ![]() |
Bonjour à tous,
je cherche à réaliser des typologies d'individus sur la base d'une enquête avec SAS; la plupart des réponses sont qualitatives. Je réalise donc une ACM (proc corresp) suivi d'une CAH (proc cluster et proc tree). Mon problème est qu'il existe de nombreuses réponses manquantes. J'ai décidé de mettre en variable supplémentaire les modalités correspondantes aux questions manquantes : par ex si pour la question 1 il y a trois modalités possibles je conserve dans l'analyse la modalité a, la b et la modalité NR sera mise en supplémentary => ceci aboutit à ce que certains individus n'est pas de réponses à une questions donnée mais j'arrive tout de même à les faire figurer sur les axes factoriels. Est ce que cela a un sens ? Comment traitez vous les réponses manquantes ? Merci de votre aide. |
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
Bonjour,
Il serait intéressant de les inclure dans la constitution de tes axes factoriels et de regarder si tu conserves la même interprétation que précédemment. |
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 12 ![]() |
Si je laisse ces modalités NR, du fait de leur faible effectif, cela tire les deux premiers axes; (la contributions aux deux premiers axes est expliqué que par ces Non réponses) : ce qui fausse l'analyse.
|
|
|
00
|
|
|
#4 |
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
je serais du même avis que toi à les mettre en individus supplémentaires, vu que ça fausse les interprétations.
|
|
|
00
|
|
|
#5 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 12 ![]() |
Merci de ton soutien,
pour aller un peu plus loin dans la réflexion, il existe biensur d'autres possibilités comme regrouper les NR avec une autre modalité ou encore imputer les NR avant de faire l'analyse.... mais cela me semble périlleux. Je peux aussi supprimer les individus avec NR ! mais après tout la présence de NR est le reflet d'un comportement particulier et donc doit être pris en compte !!!! et le fait de supprimer ces individus créé un nouveau problème : cela me fait du coup 50% d'individus en plus à reclasser avec les risques d'erreurs que cela comporte. Eric. |
|
|
00
|
|
|
#6 |
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
Tu peux remplacer les NR par la moyenne de la variable concernée mais à conditions que tes variables soient continues bien sûr.
L'imputation des valeurs manquantes pur et dur implique que ton analyse sera propre à tes données (n'incluant pas des valeurs manquantes) alors que c'est pas la réalité. Il y a bien des personnes qui ne répondent pas aux enquêtes comme moi et ne facilite pas le travail des gens comme toi!!Bon courage! |
|
|
00
|
|
|
#7 | |
|
Membre habitué
![]() ![]() Inscription : décembre 2009 Messages : 21 ![]() |
Citation:
je ne sais pas si la question est toujours d'actualité, mais si tu réalises une typologie et que tu imputes les données manquantes, tu risques de fausser considérablement les résultats (en fait de créer artificiellement les classes) compte tenu des méthodes d'imputation!! Même chose avec la moyenne des valeurs (d'autant plus que la moyenne d'une variable qualitative a un sens plus que douteux). A mon sens,il faut tenir compte de plusieurs paramètres: 1. Est-ce que les modalités manquantes sont présentes en proportions importantes par rapport aux autres modalités de la variable? Si oui, ouille. Si non, tu peux ventiler ces données manquantes (mais tu risques aussi de ventiler les modalités de faible effectif, qui après tout tireront aussi les axes simplement du fait de leur effectif!) 2. Est-ce que tu ne peux pas supprimer des individus ayant beaucoup de non-réponse? S'il y en a peu par rapport à ton echantillon total, c'est envisageable (mais tu perds tout de même de l'info : les profils de non-répondants peuvent être particulier, cf tes variables illustratives) Il me semble que l'ACM sur données incomplètes peut résoudre ce problème, mais tes axes seront tirés artificiellement par les modalités rares (à moins que tu n'en ai pas d'autres?) A bientôt, T. |
|
|
|
00
|
|
|
#8 |
|
Invité de passage
![]() Inscription : janvier 2011 Messages : 12 ![]() |
merci de ta réponse.
J'ai finalement opté par mettre les données manquantes dans des var spécifiques puis je mets ces nouvelles var en illustratives. |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com