Bonjour à tous,

Je cherche à supprimer des doublons sur même ligne dans un fichier csv.
Je m'explique :
Dans le fichier test.csv j'ai des lignes
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
1;toto;arthur
2;tata;tata
3;tata;robert
Je voudrais à l'aide de awk (qui est fait pour cela d'aprés les nombreuses pages web que je viens de lire), rechercher l'ensemble des lignes qui contienne un doublon et si c'est le cas, supprimer la ligne.

La demande est aussi possible avec la commande sed

Quelqu'un pourrait me filer un coup de main ?

Merci pour m'avoir déja lu.

Tof

EDIT : Je pense avoir trouver une piste ici : https://www.unix.com/shell-programmi...e-strings.html

Re EDIT !!!
J'ai trouvé déja la commande pour sélectionner les lignes en double :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
%awk% -F ";" "!seen[$2]++" test.csv
Info trouvé ici : https://unix.stackexchange.com/quest...n-without-sort

Et enfin pour sed :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
%sed% -rn "/(\b\w+\b).*\b\1\b/ p" test.csv
Info trouvé ici : https://stackoverflow.com/questions/...uplicate-words

Par contre comment supprimer les lignes maintenant ....