IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Linux Discussion :

Extraction de contenu entre 2 balises (Bash et code HTML)


Sujet :

Linux

  1. #1
    Membre confirmé
    Inscrit en
    Décembre 2006
    Messages
    179
    Détails du profil
    Informations forums :
    Inscription : Décembre 2006
    Messages : 179
    Par défaut Extraction de contenu entre 2 balises (Bash et code HTML)
    Bonjour à tous !

    J'essaye d'extraire toutes les lignes comprises entre 2 balises mais ça ne fonctionne pas ! Voilà ce que j'ai essayé:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ruby -ne 'if $_ =~ /<div\ class=\"contents\">\([^\"]+)\</div>/;puts $1;end' < temp.html
    Je dois extraire les lignes entre <div class="contents"> et </div>.

    Mais ça ne fonctionne pas du tout, je pense que le ruby n'est peut etre pas une bonne idée pour celà

    Merci à tous !
    RedVivi

  2. #2
    Membre confirmé
    Inscrit en
    Décembre 2006
    Messages
    179
    Détails du profil
    Informations forums :
    Inscription : Décembre 2006
    Messages : 179
    Par défaut
    J'ai aussi essayé ça mais ça ne me renvoie rien

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk '$1>="<div class=\"contents\">" && $1<="</div>"'

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    66
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Juin 2007
    Messages : 66
    Par défaut
    Bonjour,

    tu peux tenter avec SED. Exemple de base :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
     
    sed -n  '/<div class=\"contents\">/,/<\/div>/p' fichier.html
    après tu peux traiter le résulat pour enlever les balises (avec SED, par exemple )

  4. #4
    Membre confirmé
    Inscrit en
    Décembre 2006
    Messages
    179
    Détails du profil
    Informations forums :
    Inscription : Décembre 2006
    Messages : 179
    Par défaut
    Parfait ! Merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Récupérer le contenu entre deux balises même les tags html
    Par asbb.asbb dans le forum Format d'échange (XML, JSON...)
    Réponses: 0
    Dernier message: 26/02/2015, 15h23
  2. extraire du contenu entre des balises
    Par freeriders88 dans le forum ASP
    Réponses: 3
    Dernier message: 30/05/2007, 10h25
  3. Réponses: 3
    Dernier message: 04/10/2006, 22h15
  4. [Debutant]Edition du contenu entre les balises
    Par Perceval dans le forum XML/XSL et SOAP
    Réponses: 2
    Dernier message: 01/06/2005, 09h16
  5. [Balise XML] Comment récupérer le contenu entre 2 balise?
    Par ZoumZoumMan dans le forum C++Builder
    Réponses: 5
    Dernier message: 05/03/2004, 16h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo