Bonjour,
J'ai une table de données (avril17) avec un grand nombres d'observations, mais seulement trois variable: DATE (Date de la transaction), NUM_PERS (identifiant du client) et AT_SICCODE (code marchand).
Ex:
DATE NUM_PERS AT_SICCODE 01-04 00001 742 01-04 00001 5123 01-04 00002 6152 02-04 00002 6152
Je veux obtenir une nouvelle table (test1) avec la variable NUM_PERS et modifier la viable AT_SICCODE afin d'obtenir une varibale par code différent, qui indiquerait le nombre de fréquence pour la variable.
Ex:
NUM_PERS 742 5123 6152 00001 1 1 . 00002 . . 2
Donc j'ai tenté une PROC TRANSPOSE, en ajoutant un PROC SUMMARY avant pour obtenir les fréquences et ne pas avoir de problèmes avec le id dans mon PROC TRANSPOSE. Voici mes codes:
Mon problème c'est qu'en fonctionnant comme ça, lorsque un même code ets présent plus d'une fois pour un même client, il s'additionne donc au lieu d'avoir la variable 6152 avec une observation de 2 pour mon client, j'obtient une variable 12304 avec une observation de 2 pour mon client, ce qui ne me permet pas de faire plus d'analyse par la suite. Pouvez-vous m'aider à modifier mon code afin que cela n'arrive pas?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 proc summary data=avril17 T; class num_pers; var at_siccode ; output out=avril17sum sum= ; run; proc transpose data=work.avril17sum out=test1 (drop=_name_); by num_pers; var _freq_; id at_siccode; run ;
Merci.
Partager