Bonjour

Voilà mon problème : j'ai besoin de rajouter des \n dans un document HTML (renvoyé par un moteur de recherche grâce à la commande curl) avant les balises <a et après les balises </a>. Sans ça, le fichier est un gros foutoir et dur de récupérer les url des résultats retournés.

J'ai essayé d'utiliser sed mais aucun saut de ligne ne s'ajoute dans le fichier :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
 
sed "s/^\(.*\)<a\(.*\)$/\1\\n<a\2/" < request/google > cache/tmp   (google étant le fichier HTML)
sed "s/^\(.*\)<\/a>\(.*\)/$/\1\\n<\/a>\2/" < cache/tmp > cache/google
Le souci est qu'après avoir fait tourné ce petit script, il n'y a aucune différence entre le fichier request/google et cache/google.

Il y a peut-être une erreur dans l'expression régulière de sed mais je ne la trouve pas . N'y aurait-il pas une solution plus simple ?