Bonjour,

Je vais essayer d'être clair dans mon propos, sachant que c'est confus dans mon esprit!

J'ai créé une variable qui est la somme de quatre variables binaires codées 0/1 pour lesquelles il y a des données manquantes. Jusque là rien de bien folichon. Voici le code

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
data ma_base;
set ma_base;
newvar= sum(var1, var2, var3, var4);
run;
J'obtiens donc ma newvar ayant pour modalités possibles 0/1/2/3/4.
C'est là que se situe mon problème : lorsque newvar=0, cela peut venir de l'addition de 4 données manquantes, ou de 3 manquantes + 1 variable codée 0, ou de 2 manquantes + 2 variables codées 0, ou de 1 manquante + 3 variables codées 0, ou de 4 varialbles codées 0... Et ce n'est pas la même information pour moi
ça me gêne si newvar = 1 également, pour les même raisons. Si newar >=2 ça ne me gêne plus, mais ce n'est pas le sujet de ce post.
En fait pour moi newvar=0 ou 1 n'est pas interprétable si cela est du à la présence de données manquantes.

En gros j'aimerais faire la différence entre les newvar=0 ou 1 qui sont dus à la présence de données manquantes, et les autres (ou les var1 2 3 4 ne sont pas manquantes).
Y a-t'il une possibilité de faire la distinction entre les résultats dus aux données manquantes et ceux dus aux données "présentes"?

J'espère ne pas avoir trop brouillé le message.

Merci de votre aide.