Précédent   Forum des professionnels en informatique > Systèmes > Linux > Applications > Shell
Shell Vos questions sur l'utilisation des commandes shell
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 25/10/2007, 17h45   #1
Nouveau Membre du Club
 
Inscription : janvier 2006
Messages : 89
Détails du profil
Informations personnelles :
Âge : 26

Informations forums :
Inscription : janvier 2006
Messages : 89
Points : 28
Points : 28
Par défaut Sauts de ligne dans un document HTML

Bonjour

Voilà mon problème : j'ai besoin de rajouter des \n dans un document HTML (renvoyé par un moteur de recherche grâce à la commande curl) avant les balises <a et après les balises </a>. Sans ça, le fichier est un gros foutoir et dur de récupérer les url des résultats retournés.

J'ai essayé d'utiliser sed mais aucun saut de ligne ne s'ajoute dans le fichier :
Code :
1
2
3
 
sed "s/^\(.*\)<a\(.*\)$/\1\\n<a\2/" < request/google > cache/tmp   (google étant le fichier HTML)
sed "s/^\(.*\)<\/a>\(.*\)/$/\1\\n<\/a>\2/" < cache/tmp > cache/google
Le souci est qu'après avoir fait tourné ce petit script, il n'y a aucune différence entre le fichier request/google et cache/google.

Il y a peut-être une erreur dans l'expression régulière de sed mais je ne la trouve pas . N'y aurait-il pas une solution plus simple ?
Atharendil est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/10/2007, 22h29   #2
Membre expérimenté
 
Avatar de BlaireauOne
 
Inscription : mars 2007
Messages : 469
Détails du profil
Informations personnelles :
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations forums :
Inscription : mars 2007
Messages : 469
Points : 576
Points : 576
Fonctionne avec le sed du gnu

Code :
sed -e 's/<a/\n&/g' -e 's/<\/a>/&\n/g' request/google > resultat
__________________
Loi de Murphy:
La Théorie c'est quand ça ne marche pas mais que l'on sait pourquoi.
La Pratique c'est quand ça marche mais qu'on ne sait pas pourquoi.
Quand la théorie rejoint la pratique ça ne marche pas et on ne sait pas pourquoi.
BlaireauOne est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/10/2007, 23h50   #3
Nouveau Membre du Club
 
Inscription : janvier 2006
Messages : 89
Détails du profil
Informations personnelles :
Âge : 26

Informations forums :
Inscription : janvier 2006
Messages : 89
Points : 28
Points : 28
Merci j'ai testé avec les résultats de google, altavista et lycos, et ça marche parfaitement bien Je commencais à devenir fou sur ce sed qui ne voulait pas marcher
Atharendil est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 15h42.


 
 
 
 
Partenaires

Hébergement Web