IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

avec Java Discussion :

Parser page HTML en java


Sujet :

avec Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2010
    Messages
    157
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2010
    Messages : 157
    Par défaut Parser page HTML en java
    Bonjour,

    Je réalise un projet en JAVA, pour cela je dois d'abord récupérer des information à partir du web. J'ai pu réaliser la connexion avec la page web et récupérer les code source HTML dans un objet BufferReader. Et cela fonctionne bien. Maintenant je voudrais savoir comment extraire des données à partir des ligne de codes par exemple.

    quand je lie la ligne de code suivante:
    <TD><a class="normal" href="2003-resultat.html">résultat match</a></TD>

    Je voudrais savoir comment extraire "résultat match" de cette ligne de code. Je devrait d'ailleurs extraire plusieurs information du genre dans tout le code source

    Merci

  2. #2
    Membre émérite
    Homme Profil pro
    Inscrit en
    Octobre 2004
    Messages
    398
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2004
    Messages : 398
    Par défaut
    Citation Envoyé par nassim1987 Voir le message
    Bonjour,

    Je réalise un projet en JAVA, pour cela je dois d'abord récupérer des information à partir du web. J'ai pu réaliser la connexion avec la page web et récupérer les code source HTML dans un objet BufferReader. Et cela fonctionne bien. Maintenant je voudrais savoir comment extraire des données à partir des ligne de codes par exemple.

    quand je lie la ligne de code suivante:
    <TD><a class="normal" href="2003-resultat.html">résultat match</a></TD>

    Je voudrais savoir comment extraire "résultat match" de cette ligne de code. Je devrait d'ailleurs extraire plusieurs information du genre dans tout le code source

    Merci
    perso, j'utiliserais StringUtils, et les méthodes substringAfter et substringBefore

    mais si quelqu'un propose mieux ça m'interesse

  3. #3
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2010
    Messages
    157
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2010
    Messages : 157
    Par défaut
    J'ai trouvé des truc en utilisant StringTochnizer et la méthode split mais je sais pas vraiment comment les utiliser pour retrouver les mots que je recherche

  4. #4
    Membre émérite
    Homme Profil pro
    Inscrit en
    Octobre 2004
    Messages
    398
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2004
    Messages : 398
    Par défaut
    Citation Envoyé par nassim1987 Voir le message
    J'ai trouvé des truc en utilisant StringTochnizer et la méthode split mais je sais pas vraiment comment les utiliser pour retrouver les mots que je recherche
    telecharge la librairie commons-lang d'Apache ici :
    http://commons.apache.org/proper/commons-lang//

    ensuite tu pourras faire :
    String s = "<TD><a class=\"normal\" href=\"2003-resultat.html\">résultat match</a></TD>";
    s = StringUtils.substringBefore(s, "</a>");
    ....

  5. #5
    Membre expérimenté Avatar de hbennou
    Homme Profil pro
    Développeur Java
    Inscrit en
    Mai 2008
    Messages
    162
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2008
    Messages : 162
    Par défaut
    Bonsoir,

    Si tu peux encore faire marche arrière je te conseille d'utiliser l'api selenium pour ce genre de manipulation, mais il faut utiliser selenium server pour pouvoir lancer le navigateur et ouvrir la page web surlaquelle tu vas récupérer tes données.

    selenium.getText(String locator): ca ramène le texte qui est entre un tag donné.

  6. #6
    Membre éclairé
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2011
    Messages
    442
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2011
    Messages : 442
    Par défaut
    Je pense que c'est quand même mieux d'utiliser un parser HTML. Tu peux utiliser JSoup qui est assez léger et très simple d'utilisation (surtout si tu as déjà fait un peu de web).

Discussions similaires

  1. [jQuery Mobile] Dans une page HTML en Java
    Par ib.sissoko dans le forum Composants graphiques
    Réponses: 10
    Dernier message: 04/02/2014, 09h57
  2. Appel d'une page html en java
    Par ndoma dans le forum Wicket
    Réponses: 1
    Dernier message: 02/07/2010, 11h05
  3. Afficher une page html en java
    Par fonfek24 dans le forum Interfaces Graphiques en Java
    Réponses: 6
    Dernier message: 20/10/2009, 10h06
  4. changer le code d'une page html avec java
    Par fraisa1985 dans le forum Général Java
    Réponses: 2
    Dernier message: 13/03/2008, 12h29
  5. [Html] HTMLPARSER pour parser du html en Java
    Par alexthomas dans le forum API standards et tierces
    Réponses: 2
    Dernier message: 01/09/2005, 21h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo