Isoler et supprimer les doublons
Bonjour,
J'ai un fichier du type
Code:
1 2 3 4 5
| AAAAAA AA AAAAA
BBBBBB BB BBBBB
CCCCCC CC CCCCC
DDDDDD DD DDDDD
BBBBBB BB BBBBB |
Ce fichier contient une ligne en double parfait (seconde et cinquième). Je souhaite faire ceci :
1- Isoler ces deux lignes dans un nouveau fichier
2- Préfixer les deux lignes isolées par ERR suivi du numéro de ligne dans le fichier source
3- Supprimer ces deux lignes dans le fichier d'origine
Nouveau fichier
Code:
1 2 3
|
ERR 2 BBBBBB BB BBBBB
ERR 5 BBBBBB BB BBBBB |
Fichier origine devient
Code:
1 2 3
| AAAAAA AA AAAAA
CCCCCC CC CCCCC
DDDDDD DD DDDDD |
Pour identifier les enregistrements en double, je voulais utiliser la commande mais la version Linux de la machine sur laquelle je suis ne veut rien savoir.
Avez-vous une idée?
Je viens de vérifier, la commande
Code:
sort fichier | uniq -d
renvoie bien les deux lignes. Reste maintenant à mettre en place le reste du traitement.