Bonjour,
Je souhaiterais importer un fichier CSV qui a le "mauvais goût" d'être relativement gros et de contenir des variables à valeur parfois manquante. Voici le code que j'utilise :
Ce fichier contient 134 variables (dont quelques-unes de longueur de l'ordre de 40 ou 50).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 filename ref_QUES "Donnees.csv"; data QUES; infile ref_QUES firstobs=2 truncover dsd delimiter=';'; input CURSUS :$2. DIPL :$3. SPEC :$5. no_quest q_3 :$3. mois_naissance an_naissance q_2 :$3. sexe :$1. q_1 :$3. commune :$28. cp_commune :$5. q1 :$2. q1_rep1 :$1. q1_rep2 :$40. Q2a :$3. Q2a_rep1 :$1. Q2b :$3. Q2b_rep1 :$1. Q2b_rep2 :$1. Q2b_rep3 :$1. /* etc ... etc ... */ ; run;
A première vue, le résultat semble correct mais, à regarder plus en détail, il apparaît que les dernières variables ne sont pas toujours importées. Cela est-il dû à la taille trop élevée des enregistrements. Y a-t-il une taille limite ? Si oui, quel remède (ou pseudo-remède) peut-on apporter ?
Dans la Log, j'ai le message suivant (mentionnant notamment la troncature d'observations !) :
Merci !
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 NOTE: The infile REF_QUES is: Nom du fichier=Donnees.csv, RECFM=V,LRECL=256, Taille de fichier (octets)=855288, NOTE: 2491 records were read from the infile REF_QUES. The minimum record length was 256. The maximum record length was 256. One or more lines were truncated. NOTE: The data set WORK.QUES has 2491 observations and 134 variables.
Partager