Précédent   Forum des professionnels en informatique > Systèmes > Linux > Applications > Shell
Shell Vos questions sur l'utilisation des commandes shell
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
Vieux 28/01/2010, 02h23   #1
Invité de passage
 
Inscription : novembre 2007
Messages : 7
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 7
Points : 1
Points : 1
Par défaut Extraire info d'un fichier HTML

Bonjour,

Je viens de demander votre aide, car je ne suis compétant bash.

Extraire une sous-chaine d'un fichie.html
voici l'exemple:
Code html :
1
2
3
<div class="infosPermanentes"><p class="Idclient">284936</p><h2 class="nomclient">La Croix </h2>
<address class="adresseClient">20 rue Georges Bouttie - 72000  Le Mans  </address>
<h3 class="activiteclient">Activités : triperie </h3></div>


j'aimerai un script qui fait l'extraction des information comme suit:


Code :
284936;La Croix;20 rue Georges Bouttie; 72000;Le Mans;triperie
Merci

Dernière modification par al1_24 ; 28/01/2010 à 08h56. Motif: Balises code
zaydoun_391 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/01/2010, 05h12   #2
Expert Confirmé
 
Avatar de N_BaH
 
Inscription : février 2008
Messages : 1 896
Détails du profil
Informations forums :
Inscription : février 2008
Messages : 1 896
Points : 3 676
Points : 3 676
Bonjour Zaydoun,
Citation:
Je viens de demander votre aide, car je ne suis compétant bash.
Ça tombe bien on ne va pas s'en servir
Code :
1
2
sed 's/.*Idclient">\([^<]*\).*nomclient">\([^<]*\) .*adresseClient">\([^<]*\) .*activiteclient">Activités : \([^<]*\).*/\1;\2;\3;\4/; s/ - /;/; s/  /;/g; s/ ;/;/g' fichier.in
284936;La Croix;20 rue Georges Bouttie;72000;Le Mans;triperie

Dernière modification par N_BaH ; 28/01/2010 à 09h46.
N_BaH est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +1. Il est actuellement 16h16.


 
 
 
 
Partenaires

Hébergement Web