Hello,
Pour un projet perso je travail avec une énorme liste de nom de domaine (+ de 50000), seulement certains comportent encore le fameux "www." de début d'url que je souhaite supprimer automatiquement, avant un effacement des doublons pour éviter les erreurs par la suite.
Pour le moment voilà ce que ça donne:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
#!/bin bash
 
#Suppression du www.
sed 's/www.//' fichier_temp.txt > /home/user/Bureau/fichier_temp.txt
 
#Effacement des doublons
sort -g /home/user/Bureau/fichier_temp.txt | uniq > /home/user/Bureau/fichier_final.txt
 
#Effacement du fichier temporaire
rm /home/user/Bureau/fichier_temp.txt
Le fichier temp me sert de lien entre les deux commandes mais il existe surement plus simple.
Si quelqu'un peut me dire si j'ai tout bon car j'ai peur que ce script efface également les 'www.' pouvant se trouver ailleurs qu'en début de ligne, par exemple que "www.developpezwww.zty" devienne "developpez.zty" ce qui n'est pas le but rechercher surtout pour mon projet.