Bonjour,
J'ai peu de pratique de SAS. Je dois importer d'énormes fichiers texte (plusieurs millions de lignes). Le délimiteur est tabulation. Les données manquantes sont indiquées par "\N", pour les variables numériques comme pour les var. caractères.
Le pb de la proc import est qu'elle se sert des premières lignes pour aviser sur le type de variable. J'ai vu qu'il y a une option pour augmenter le nb de lignes examinées. Mais, dans mon cas, il faut parfois aller à plusieurs centaines de milliers voire millions de lignes pour rencontrer un "\N". Alors, j'ai choisi une étape date et infile.
Est-il préférable, malgré la présence du séparateur, de spécifier les positions des colonnes où sont les données ?
Je veux en effet m'assurer que les "\N" seront transformés en "." pour les variables numériques et en espace pour les varaibles alphanum.
Comment et à quel moment indiquer de transformer les "\N" des colonnes alphanumériques en valeurs manquantes ?
Je dois également créer des index sur plusieurs variables. A quel moment le faire ?
Merci d'avance pour vos réponses.