IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

Récupérer un élément html contenant un texte spécifique


Sujet :

Langage Java

  1. #1
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Février 2018
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Février 2018
    Messages : 2
    Points : 3
    Points
    3
    Par défaut Récupérer un élément html contenant un texte spécifique
    Salut à tous !

    Mon but ultime :

    Récupérer les Elements (au sens de JSoup) d'une page html contenant le symbole € dans leur texte (codé par &euro).

    Ligne contenue dans mon String html :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <span class="nodisplay">41,93 &euro;</span>

    Contrainte :

    Je ne veux pas avoir à utiliser une recherche sur le "span" ou un quelconque autre tag, ni attribut. Juste sur le texte.

    Actuellement, j'en suis là :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    Document doc = Jsoup.parse(html);
     
    Elements ePrice = doc.getElementsContainingOwnText("&euro"); //à priori, l'erreur est là
     
    System.out.println(Integer.toString(ePrice.size())); //return 0
     
    for (Element element : ePrice)
    { 
        System.out.println(element.ownText()); //ne retourne rien (forcément)
    }
    Je ne comprends pas mon erreur. Est-ce que j'utilise mal cette méthode ? Est-ce que j'utilise la mauvaise ? Devrais-je utiliser autre chose que JSoup ?

    Merci beaucoup par avance !

  2. #2
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Points : 29 131
    Points
    29 131
    Billets dans le blog
    2
    Par défaut
    Salut,

    Le souci c'est que le text dans le html contient une entité (&euro;) et que getElementsContainingOwnText cherche un texte brut, sans entité. Il faut donc chercher une chaîne qui correspond à l'entité soit "€".

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Elements ePrice = doc.getElementsContainingOwnText("€");
    Tu peux faire comme ça aussi par exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Elements ePrice = doc.getElementsContainingOwnText(Entities.getByName("euro"));
    Ou encore :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Elements ePrice = doc.getElementsContainingOwnText("\u20AC");
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  3. #3
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Février 2018
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Février 2018
    Messages : 2
    Points : 3
    Points
    3
    Par défaut
    Salut !

    Ça fonctionne !!! Merci beaucoup pour ton explication, et pour avoir donné plusieurs solutions !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 06/11/2013, 12h03
  2. Récupérer une page HTML contenant de l'AJAX
    Par pouic06 dans le forum Général Java
    Réponses: 2
    Dernier message: 04/05/2012, 10h17
  3. Réponses: 1
    Dernier message: 23/04/2010, 11h34
  4. Récupérer l'élément contenant le curseur
    Par mlny84 dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 03/08/2009, 12h02
  5. Réponses: 1
    Dernier message: 08/09/2007, 19h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo