|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||||
|
Candidat au titre de Membre du Club
![]() Inscription : février 2007 Messages : 22 ![]() |
Bonjour,
Je dispose d'un fichier csv assez conséquent (100.000 lignes pour 150 colonnes environ) Chaque ligne représente un ensemble de données. Je souhaite créer nbColonnes - 1 fichiers représentants la liste des valeurs de chacun de ces champs(sans doublon) suivant le champ n°6 par exemple. J'ai tenté deux essais (un avec "awk" & "sed", l'autre avec "cut") mais le traitement reste tres lent (+ de 5minutes pour "cut" et bcp plus pour l'autre technique). Voici mes deux codes Code essai avec sed & awk :
Code avec cut :
Je ne sais que faire.... J'ai tenté une solution en java qui n'a pas été concluante et j'hésite à passer au C EDIT: Un exemple de ce que je souhaiterais le fichier est a;b;c 0;2;5 1;7;3 1;5;3 et je voudrais 2 fichiers 1er fichier: c;a 5;0 3;1 2eme fichier c;b 5;2 3;7 3:5 ReEDIT: J'ai oublié de préciser que c'est le "sed" qui fait traîner le premier script |
||||
|
|
00
|
|
|
#2 | |||
|
Membre expérimenté
![]() Inscription : mars 2007 Messages : 469 ![]() |
Citation:
Si j'ai bien compris, morceau de code qui doit marcher http://lea-linux.org/cached/index/Dev-awk.html Code :
|
|||
|
|
00
|
|
|
#3 |
|
Candidat au titre de Membre du Club
![]() Inscription : février 2007 Messages : 22 ![]() |
Merci, mais ton script est encore trop lent
Est-il donc possible d'ecrire un script plus rapide ou me conseillez vous de passer à un programme en C |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com