IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Apache Discussion :

[Digester] lire des balises html


Sujet :

Apache

  1. #1
    Membre averti Avatar de Jean-Philippe Shields
    Profil pro
    Inscrit en
    Novembre 2005
    Messages
    278
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : Canada

    Informations forums :
    Inscription : Novembre 2005
    Messages : 278
    Points : 340
    Points
    340
    Par défaut [Digester] lire des balises html
    Bonjour à tous,

    J'ai une question assez simple, mais dont je n'ai pas encore trouvé de réponse. J'utilise Jakarta Commons-Digester pour lire un fichier XML et je veux récupérer à l'intérieur d'un tag <DataContent> du code html qui contient des balises. J'ai l'impression que digester le digère très mal de lire d'autres balises.

    Par exemple:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    <DataContent>
    <p>La lutte contre le feu a fini par porter ses fruits dans la région espagnole
     de Galice, après 12 jours d'incendies volontaires, laissant place à une 
    polémique sur la superficie consumée.</p> 
     
    <p>La lutte contre le feu a fini par porter ses fruits dans la région espagnole
     de Galice, après 12 jours d'incendies volontaires, laissant place à une 
    polémique sur la superficie consumée.</p> 
    </DataContent>
    Ma règle est simplement
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <bean-property-setter-rule pattern="DataContent" propertyname="content"/>
    Mais l'attribut de mon objet java ne contient rien (une string vide ""). Est-ce que c'est possible que digester considère le <p> comme une autre balise du fichier xml et qu'il ne veuille pas la lire?

    Toutes les idées sont les bienvenues. merci
    RCP rulez!

  2. #2
    Membre éprouvé

    Homme Profil pro
    Inscrit en
    Mars 2003
    Messages
    291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Mars 2003
    Messages : 291
    Points : 1 059
    Points
    1 059
    Par défaut
    Oui le digester est troublé par ton HTML
    Normalement en XML tu dois encadrer les données textes contenant des balises qui ne doivent pas être parser dans une section CDATA. Dans ton exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    <DataContent><![CDATA[ 
    <p>La lutte contre le feu a fini par porter ses fruits dans la région espagnole
     de Galice, après 12 jours d'incendies volontaires, laissant place à une 
    polémique sur la superficie consumée.</p> 
     
    <p>La lutte contre le feu a fini par porter ses fruits dans la région espagnole
     de Galice, après 12 jours d'incendies volontaires, laissant place à une 
    polémique sur la superficie consumée.</p> 
    ]]></DataContent>
    http://beuss.developpez.com
    Tutoriels PostgreSQL, Assembleur, Eclipse, Java

  3. #3
    Membre averti Avatar de Jean-Philippe Shields
    Profil pro
    Inscrit en
    Novembre 2005
    Messages
    278
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : Canada

    Informations forums :
    Inscription : Novembre 2005
    Messages : 278
    Points : 340
    Points
    340
    Par défaut
    Merci pour ta réponse,

    J'ai aussi réussit à contourner le problème, si je tiens absoluement à ne pas modifier le fichier xml, en utilisant la règle NodeCreateRule. Cette règle crée un ElementNode sur le stack de Digester et je le pase à un objet par la suite avec setNextRule. Je dois cependant trimmer les balises <DataContent> et </DataContent> en recevant mon ElementNode.toString().

    Je vais considérer ta solution sérieusement, car ça me semble plus facile et évident de modifier le xml avec XSL que de faire ce que j'ai implémenté.
    RCP rulez!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [RegEx] Lire le contenu des balises HTML
    Par ChriGoLioNaDor dans le forum Langage
    Réponses: 1
    Dernier message: 14/04/2010, 08h41
  2. Insérer des Balises HTML dans un champ mémo
    Par Heureux-oli dans le forum IHM
    Réponses: 18
    Dernier message: 21/03/2007, 20h05
  3. [AJAX] Traitement des balises html
    Par Mysti¢ dans le forum Général JavaScript
    Réponses: 6
    Dernier message: 13/08/2006, 22h07
  4. [XSLT][>HTML]Affiché des balises HTML
    Par tiboel dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 26/06/2006, 20h15
  5. faire passer des balise html d'un XML vers un XLS
    Par shaftJackson dans le forum XML/XSL et SOAP
    Réponses: 5
    Dernier message: 26/04/2006, 16h07

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo