Bonjour,
J'ai un fichier de données qui fait a peu près 200 lignes* 1000000 colonnes à la queue leu-leu , je sais pertinemment bien qu'il est impossible de faire lire ce fichier avec le logiciel R à moins que quelqu'un aurait une idée pour faire lire le fichier en entier avec R ( ça m'étonnerait ) ??
Donc je vais essayer d'extraire les 200 lignes , ligne par ligne c'est à dire faire 200 data ( 1*1000000 colonnes), en sachant que je possède la colonne de référence (ID ( j'en ai 200 ID)) pour pouvoir extraire mes datas??
je ne sais pas si la fonction scan dans un petit programme avec l'ID peut faire l'affaire??
une illustration de mon fichier:
1 "BB-001-10" 1 2 3 ACGTGCCGATGCATAC........GTG 1 "BB-002-10" 0 3 4 AG CGATACGTAC..........GTTGCAC 0 "BB-003-52" 0 5 2 AGTCGTACGTAT...........GCCGTAT
Il y a 1 million de champs ( la longueur de la ligne pour chaque ID) entre le premier ID qui est BB-001-10 et le deuxième BB-002-10 et ainsi de suite.
Quelqu'un aurait t il une idée pour faire cette extraction ? toutes suggestions seront les bienvenues
Bien a vous
Manoir
Partager