[Bash] Script de nettoyage
Hello,
Pour un projet perso je travail avec une énorme liste de nom de domaine (+ de 50000), seulement certains comportent encore le fameux "www." de début d'url que je souhaite supprimer automatiquement, avant un effacement des doublons pour éviter les erreurs par la suite.
Pour le moment voilà ce que ça donne:
Code:
1 2 3 4 5 6 7 8 9 10
| #!/bin bash
#Suppression du www.
sed 's/www.//' fichier_temp.txt > /home/user/Bureau/fichier_temp.txt
#Effacement des doublons
sort -g /home/user/Bureau/fichier_temp.txt | uniq > /home/user/Bureau/fichier_final.txt
#Effacement du fichier temporaire
rm /home/user/Bureau/fichier_temp.txt |
Le fichier temp me sert de lien entre les deux commandes mais il existe surement plus simple.
Si quelqu'un peut me dire si j'ai tout bon car j'ai peur que ce script efface également les 'www.' pouvant se trouver ailleurs qu'en début de ligne, par exemple que "www.developpezwww.zty" devienne "developpez.zty" ce qui n'est pas le but rechercher surtout pour mon projet. :?