|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Candidat au titre de Membre du Club
![]() Inscription : septembre 2006 Messages : 22 ![]() |
Bonjour à tous,
J'aimerais faire de l'imputation statistique sur des données manquantes, c'est à dire déterminer les valeurs les plus probables prises par les variables en question en fonction d'autres variables. Apparemment, "PROC MI" est la procédure à utiliser. Mais j'ai un peu de mal à comprendre l'objectif de l'imputation multiple. Ce qui me surprend est que la méthode PROC MIANALYZE semble juste établir des statistiques sur les différentes valeurs imputées mais pas de trancher sur -la- valeur la plus plausible... Du coup, je ne saisis pas son utilité. Est-ce qu'il suffirait dans mon cas de faire de l'imputation simple (i.e. spécifier NIMPUTE à 1) ? Merci d'avance, Mark |
|
|
00
|
|
|
#2 | |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Bonjour Mark.
J'ai l'impression que tu es dans le même cas que Lilouche dans son message ici. Non, MIANALYZE ne tranche pas quant à savoir quelle est la "meilleure" valeur imputée : elles sont toutes bonnes. Citation:
Olivier |
|
|
|
00
|
|
|
#3 |
|
Candidat au titre de Membre du Club
![]() Inscription : septembre 2006 Messages : 22 ![]() |
Bonjour Olivier,
Merci pour ta réponse. J'avais lu ton message à Lilouche mais je ne comprends pas concrètement la finalité de l'imputation multiple. Est-ce qu'on est censé travailler après non plus sur un jeu de données mais sur N ? Dans l'aide de SAS, il est dit que PROC MIANALYZE "combine" les différentes valeurs, c'est ce terme qui m'a induit en erreur. D'autre part, est-ce qu'il n'existe pas de "meilleure" valeur vers laquelle la méthode de MCMC va converger ? C'est aussi cet aspect qui me trouble... Merci, Mark |
|
|
00
|
|
|
#4 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
En fait, le MCMC converge vers une distribution, pas une valeur. Donc toute valeur tirée dans cette distribution est "bonne".
Oui, la logique de l'imputation multiple est ensuite de travailler sur TOUS les jeux de données en parallèle (avec un BY). D'où le recours ensuite à MIANALYZE pour combiner les résultats (d'une régression, d'un calcul de médiane, d'une corrélation, ...) sur les différents jeux de données. |
|
|
00
|
|
|
#5 |
|
Candidat au titre de Membre du Club
![]() Inscription : septembre 2006 Messages : 22 ![]() |
Ok, c'est plus clair maintenant.
Merci beaucoup ! Mark |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com