IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XML/XSL et SOAP Discussion :

parser une page HTML


Sujet :

XML/XSL et SOAP

  1. #1
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut parser une page HTML
    Bonjour,
    J'ai une page web qui contient un article que je dois le récuperer pour mon application iphone pour cela je dois utiliser Xpath pour récuperer le chemin vers la balise HTML contenant le texte avec l'expression suivante:
    Le problème est qu'il récupère seulement la derniere ligne de l'article, et je ne comprend pas pourquoi.
    Le lien de la page web:
    http://m.minutebuzz.com/Nouvelle-cam...to-_a3353.html

    merci de votre aide

  2. #2
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Citation Envoyé par mou93 Voir le message
    Le problème est qu'il récupère seulement la derniere ligne de l'article, et je ne comprend pas pourquoi.
    Pour des raisons extérieures au xPath que tu nous as montré. ce xPath est très correct et je ne sais pas ce que tu fais à part ça.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  3. #3
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    Ok merci je voulais juste m'assurer que le problème ne vienne pas du xPath . et si je voulais récuperer juste le mot Voilà qui se trouve après la balise
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <div class="texte" > Voilà
    Comment j'écrirai en xPath?

  4. #4
    Membre Expert
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    1 466
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 466
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    div[@class='texte']/text()

  5. #5
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Euh, à condition que le but soit de récupérer tout ce qui se trouve avant le texte en gras.

    Si par hasard le but était de récupérer le premier mot... Bah, je dois dire que j'en sais rien.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  6. #6
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    @Morbo merci ca marche il me manquait juste text() et comment je fais pour récuperer tout le texte (avec les mots qui sont en gras sous les balises <strong>). J'ai testé ceci mais ca ne marche pas:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    //div[@class='cel1']/div[@class='inner']/div[@class='texte']/text()|strong
    @thelvin mon but était de récuperer le texte qui se trouvait dans car je ne pouvait que récuperer des mots en gras qui étaient dans la balise <strong>

  7. #7
    Membre Expert
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    1 466
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 466
    Par défaut
    J'ai fait quelques tests avec
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <xsl:value-of select="//x:div[@class='texte']/descendant-or-self::*"/>
    et
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <xsl:value-of select="//x:div[@class='texte']"/>
    qui donnent le texte de la sous hiérarchie.

    Vu qu'apparemment t'as pas besoin de préfixe, pour toi ce serait juste :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <xsl:value-of select="//div[@class='texte']"/>

  8. #8
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Et si ce n'est pas dans du XSLT et que tu veux juste un xPath, ceci devrait faire l'affaire :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    string(//div[@class='texte'])
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  9. #9
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    @Morbo C'est ce que j'ai mis au début mais je n'ai que la dernière phrase du texte. il n' y a pas une autre expression qui réunit la fonction text() avec les balises strong

  10. #10
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    C'est quoi XSLT? Je n'y connais pas grand chose car mon programme est en objective c et il récupère les xpath sous forme de string
    J'ai essayé avec string(//div[@class='texte']) mais ca ne marche.

  11. #11
    Membre Expert
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    1 466
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 466
    Par défaut
    T'as essayer aussi :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    //div[@class='texte']/descendant-or-self::*
    Voir peut être :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    //div[@class='texte']/descendant-or-self::*/text()
    Sinon, faudrait peut être passer par du xsl-t pour faire le ménage des balises.

  12. #12
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    Merci encore une fois ca marche avec la deuxième expression:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    //div[@class='texte']/descendant-or-self::*/text()
    Parcontre il y a un moyen d'afficher les accents et autres caractères spéciaux car il m'affiche sur la console par exemple :
    nodeContent="Voil\U221a\U2020 ";
    pour le mot voilà et sur l'interface graphique ca donne: Voil√© .

  13. #13
    Membre Expert
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    1 466
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 466
    Par défaut
    Ben, faut faire gaffe à lire le fichier en tenant compte de son encodage du coté de java.

  14. #14
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 8
    Par défaut
    Désolé mais je vois pas trop comment faire?En faite le programme est en objective c étant donné que c'est pour une application iphone.
    Je pense que c'est codé en UTF8. C'est un programme que j'ai trouvé sur ce lien http://blog.objectgraph.com/index.ph...e-development/.

Discussions similaires

  1. Parser une page HTML avec du PHP
    Par Richard_Rahl dans le forum Langage
    Réponses: 9
    Dernier message: 19/08/2008, 15h36
  2. Parser une page html ?
    Par SimoX1 dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 03/12/2006, 19h10
  3. Parser une page Html pour récuperer valeur
    Par Andry dans le forum Delphi
    Réponses: 5
    Dernier message: 01/12/2006, 17h10
  4. Parser une page html, quel outil ?
    Par ggnore dans le forum Linux
    Réponses: 5
    Dernier message: 28/11/2006, 11h48
  5. parser une page HTML pour en retirer de l'info
    Par belakhdarbts10 dans le forum ASP
    Réponses: 1
    Dernier message: 29/10/2006, 18h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo