Bonjour à tous,

Je débute dans SAS, et j’aimerais utiliser cet outil pour effectuer l’analyse de mes données. J’ai un énorme tableau (format excel ou csv) contenant l’activité par minute de plusieurs sujets sur plusieurs semaines.

C1 C2 B3 ...
T1 val val val ...
T2 val val val ...
T3 val val val ...
T4 val val val ...
... ... ... ... ...

La première colonne (T1, T2, etc.) contient les informations de temps pour chaque ligne, chaque ligne représentant une minute (au format excel, 01/09/2014 09:00, 01/09/2014 09:01, etc.). Les autres colonnes contiennent les valeurs pour chaque sujet (C1, C2, B3, etc.).

Mes sujets sont repartis en deux groupes. Je pourrais ajouter cette variable dans mon fichier de données, mais je ne sais pas comment importer mes données correctement, d’autant que je dois utiliser la fonction TRANSPOSE.

Idéalement, j’aimerais arriver à un tableau de ce genre :

Obs ID Group T1 T2 T3 T4 ...
1 C1 C val val val val ...
2 C2 C val val val val ...
3 B3 C val val val val ...
4 S1 S val val val val ...
... ... ... ... ... ... ... ...

Pour l’instant, j’utilise ce code :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
data activity;
infile 'C:\folder\files\data.csv' dsd;
length time_id $ 16;
input time_id $ C1 C2 C3 C4 C5 C6 C7 C8 B2 S1 S2 S3 S4 S5 S7 S8 B1 B3;
run;
 
proc transpose data=activity out=activity_trans name=ID;
id time_id;
run;
 
proc print data=activity_trans;
run;
Avec le code précèdent, j’arrive simplement à ça :

Obs ID T1 T2 T3 T4 ...
1 C1 val val val val ...
2 C2 val val val val ...
3 B3 val val val val ...
4 S1 val val val val ...
... ... ... ... ... ... ...

Bien entendu, les informations de temps ne sont pas "formatées" pour SAS et ne sont pas, je pense, utilisable pour le moment.

Je dois trouver un moyen d’ajouter une variable "groupe" séparant mes valeurs en deux, ainsi que des informations de temps correctes pour pouvoir facilement manipuler mes données. J’aimerais pouvoir facilement calculer des moyennes entre groupes, par heures ou par minutes, en spécifiant un laps de temps précis, etc.

Mes questions sont donc les suivantes :

Comment ajouter une variable "groupe" contenant C et S et comment distribuer mes sujets dans ces deux variables ?

Comment lire correctement les données de temps importées d’excel dans un format que SAS peut comprendre ?

Merci infiniment pour votre aide