Bonjour,

Je cherche à automatiser le calcul d'un score après une régression logistique.
Dans un 1er temps je récupère les estimations des paramètres sur un échantillon d'apprentissage.
Ensuite je veux calculer un score sur un jeu de données test à partir des estimations de l’échantillon d"apprentissage.

Sur un exemple, voilà comment je procède actuellement :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
data covar;
input aaa bbb ccc ;
cards;
0 0 1
1 1 1
1 1 0
0 1 1
1 1 1
0 0 2
1 0 0
1 0 1
1 1 0
0 1 2
run;
 
data estim;
input name$ estim;
cards;
aaa1 0.879
bbb1 0.578
ccc1 0.937
ccc2 0.376
run;
 
/* Création macro-variables avec l'estimation associée à chq variable */
DATA _null_;
SET estim;
call symputx(name , estim);
run;
 
/* Attribution des valeurs des estimations */
data tmp;
set covar;
if aaa=0 then V_1=0; if aaa=1 then V_1=&aaa1;
if bbb=0 then V_2=0; if bbb=1 then V_2=&bbb1;
if ccc=0 then V_3=0; if ccc=1 then V_3=&ccc1; if ccc=2 then V_3=&ccc2;
run;
 
/* Calcul d'un score pr chq individu */
DATA score;
set tmp;
ARRAY V_col[3] V_1-V_3 ;
score=0;
DO i = 1 TO 3 ;
	score=score+V_col[i];
end;
drop i;
RUN;
Le nombre de variables et le nombre de modalités par variables étant variables, je cherche donc à automatiser cette procédure. Est-ce que vous auriez quelques pistes à me conseiller ? Merci d'avance !