IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

Utilisation de jsoup


Sujet :

Langage Java

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Août 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2003
    Messages : 117
    Points : 68
    Points
    68
    Par défaut Utilisation de jsoup
    Bonjour

    Le programme qui suit me permet de parser une page HTML.
    Celui-ci fonctionne parfaitement tant que le nombre de myLink" et de myPrices est égal.
    Seulement parfois le prix n'est pas indiqué et la balise "price" n'existe pas ce qui engendre une différence entre "title" et "prix" et une erreur de type :
    java.lang.IndexOutOfBoundsException, ce qui est normal.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    Document myDoc = Jsoup.connect("maPage.html").get();
    Elements myContent = myDoc.select("div.list-oag");
    Elements myLink = myContent.select("a");
    Elements myPrices = myContent.select("div.price");
     
    String[] title = new String[myLink.size()];
    String[] prix = new String[myPrices.size()];
     
    for(int i=0;i<myLink.size();i++){
          title[i] = myLink.get(i).getElementsByClass("title").text();
          prix[i] = myPrices.get(i).getElementsByClass("price").text();
    }
     
    for(int j=0;j<myLink.size();j++){  
           out.println(title[j]);
           out.println(" - Prix: "+prix[j]);
           out.println("<br>");
    }
    Comment faire pour parser le document et associer le bon prix au bon title ?

    Merci d'avance !

  2. #2
    Membre du Club
    Profil pro
    Inscrit en
    Août 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2003
    Messages : 117
    Points : 68
    Points
    68
    Par défaut
    Bon pour repondre à ElSpopo dont la message a disparu ????
    Et qui a ecrit :
    il faudrait que tu essais de te baser sur un élément commun entre ton prix et ton titre (peut être sont ils dans un même div ou une même ligne de tableau.
    peux tu nous montrer un exemple de la page html en question?
    L'ensemble des informations a recuperer se trouvent entre une balise <a>

    Voici un fragment du code HTML:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
     
    <div class="list-oag">
       <a title="Titre de l'ouvrage">
          <div class="aog">
             <div class="date">
                <div>3eme empire</div>
                <div>150 av JC</div>
             </div>
             <div class="detail">
                <div class="title">Titre de l ouvrage</div>
                <div class="category"> Mathematique</div>
                <div class="placement"> Athene </div>
                <div class="price"> 7800 € </div>
             </div>
          </div>
       </a>
       <a>
       ...... Même code .....
       </a>
    ....
    Si ça peut éclaircir ma requête !!!!

  3. #3
    Membre actif
    Homme Profil pro
    Développeur Java / JEE
    Inscrit en
    Février 2008
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur Java / JEE

    Informations forums :
    Inscription : Février 2008
    Messages : 185
    Points : 293
    Points
    293
    Par défaut
    Bonjour,

    Ton problème vient de ta boucle "for" :
    Tu incrémentes de 0 à myLink.size(), mais dedans tu fais un myPrices.get(i).
    Ceci pose un problème si myPrices contient moins d'éléments que myLink...

    Mathieu

  4. #4
    Membre du Club
    Profil pro
    Inscrit en
    Août 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2003
    Messages : 117
    Points : 68
    Points
    68
    Par défaut
    Merci Influenza mais je sais que mon problème vient de la boucle "for"
    Je n'arrive pas à voir comment faire pour analyser chaque balise <a> contenue dans 'list-oag" pour récupérer le titre et le prix qui lui est associé !!!!

  5. #5
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Il faut sélectionner myLink et myPrice à l'intérieur de ta boucle for, et seulement à partir de la seule et unique balise <a> que la boucle en cours est en train de regarder.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  6. #6
    Membre actif
    Homme Profil pro
    Développeur Java / JEE
    Inscrit en
    Février 2008
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur Java / JEE

    Informations forums :
    Inscription : Février 2008
    Messages : 185
    Points : 293
    Points
    293
    Par défaut
    Bonjour,

    J'ai lu un peu vite ton post, désolé.
    Comme le dit thelvin, tu devrais faire dans ta boucle "for" un truc du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Elements myPrices = myLink.get(i).select("div.price");
    ou
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    myLink.get(i).getElementsByClass("price");
    Qui devrait te ramener 0 ou 1 prix.

    Mathieu

  7. #7
    Membre du Club
    Profil pro
    Inscrit en
    Août 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2003
    Messages : 117
    Points : 68
    Points
    68
    Par défaut
    J'ai trouvé une solution qui fonctionne bien.
    J'utilisai une boucle "for" de trop.

    Si ça peut servir à d'autre, voici le code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
     
    Document myDoc = Jsoup.connect("maPage.html").get();
    Elements myContents = myDoc.select("div.list-oag");
     
    for (Element myContent : myContents) {
       Elements balisesA = myContent.select("a");
       String[][] livres= new String[balisesA.size()][2];
       for (int i = 0; i < balisesA.size(); i++) {
     
          livres[i][0] = balisesA.get(i).getElementsByClass("title").text();
          livres[i][1] = balisesA.get(i).getElementsByClass("price").text();
     
        }
     
        for(int k=0;k<balisesA.size();k++){
           out.println("Titre : "+livres[k][0]);
           out.println(" - Prix: "+livres[k][1]);
           out.println("<br>");
         }
    }
    Bien sur, si il y a mieux ou plus propre, je suis preneur.

    Si quelqu'un pouvait m'expliquer la nuance entre Element et Elements de Jsoup...

    Merci.

Discussions similaires

  1. Utilisation bibliothèque Jsoup
    Par alamkouki dans le forum Développement Web en Java
    Réponses: 2
    Dernier message: 22/07/2013, 13h33
  2. utiliser les tag [MFC] [Win32] [.NET] [C++/CLI]
    Par hiko-seijuro dans le forum Visual C++
    Réponses: 8
    Dernier message: 08/06/2005, 15h57
  3. utilisation du meta type ANY
    Par Anonymous dans le forum CORBA
    Réponses: 1
    Dernier message: 15/04/2002, 12h36
  4. [BCB5] Utilisation des Ressources (.res)
    Par Vince78 dans le forum C++Builder
    Réponses: 2
    Dernier message: 04/04/2002, 16h01
  5. Réponses: 2
    Dernier message: 20/03/2002, 23h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo