Bonjour à tous,
Je cherche à supprimer des doublons sur même ligne dans un fichier csv.
Je m'explique :
Dans le fichier test.csv j'ai des lignes
1 2 3
| 1;toto;arthur
2;tata;tata
3;tata;robert |
Je voudrais à l'aide de awk (qui est fait pour cela d'aprés les nombreuses pages web que je viens de lire), rechercher l'ensemble des lignes qui contienne un doublon et si c'est le cas, supprimer la ligne.
La demande est aussi possible avec la commande sed
Quelqu'un pourrait me filer un coup de main ?
Merci pour m'avoir déja lu.
Tof
EDIT : Je pense avoir trouver une piste ici : https://www.unix.com/shell-programmi...e-strings.html
Re EDIT !!!
J'ai trouvé déja la commande pour sélectionner les lignes en double :
%awk% -F ";" "!seen[$2]++" test.csv
Info trouvé ici : https://unix.stackexchange.com/quest...n-without-sort
Et enfin pour sed :
%sed% -rn "/(\b\w+\b).*\b\1\b/ p" test.csv
Info trouvé ici : https://stackoverflow.com/questions/...uplicate-words
Par contre comment supprimer les lignes maintenant ....
Partager