IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement Web en Java Discussion :

Parseur HTML en Jsoup PHP


Sujet :

Développement Web en Java

  1. #1
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Septembre 2013
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Septembre 2013
    Messages : 4
    Points : 4
    Points
    4
    Par défaut Parseur HTML en Jsoup PHP
    Bonjour,
    je viens demandé de l'aide sur un projet parseur HTML en utilisant DOM.
    j'ai fait tout le tour des langage pour parser la page www.speedtest.net/results.php j'aimerai parser et récupérer les donnés se trouvant dans la balise <tbody>.
    j'utilise comme parseur http://simplehtmldom.sourceforge.net/ qui marche bien si la page résultat est enregistré sur un fichier html.
    Pour parser les données

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    <?php 
     
    include('simple_html_dom.php');
    $html = file_get_html('http://www.karamna.net/test.html');
     
     $dates  = $html->find('body tr td', 2)->innertext; // result: "ok"
    //echo $dates . "<br>";
     
     $ip  = $html->find('body tr td', 3)->innertext ; // result: "ok"
    //echo $ip. "<br>";
     
    $up  = $html->find('body tr td', 4)->innertext ; // result: "ok"
    //echo $up. "<br>";
     
    $down  = $html->find('body tr td', 5)->innertext ; // result: "ok"
    //echo $down. "<br>";
    $delai  = $html->find('body tr td', 6)->innertext ; // result: "ok"
    //echo $delai. "<br>";
    $country = $html->find('body tr td', 7)->innertext ; // result: "ok"
    ?>
    en Java
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
     
    package javajsoup;
     
    import java.io.IOException;
    import java.util.ArrayList;
     
    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    import org.jsoup.select.Elements;
     
     
     
    public class Main {
     
    	public static void main(String[] args) {
    		Document doc;
    		Document doc2;
     
    	try {
    		doc2 = Jsoup.connect("http://www.speedtest.net").get();	
    		doc = Jsoup.connect("http://www.speedtest.net/result.php").get();
     
    		String titre = doc.title();
    		System.out.println("The Title is " + titre);
     
    		Elements urls = doc.select("tbody tr  td ");
     
    		String done;
    		String date = null;
    		ArrayList<String> ar = new ArrayList<String>();
    		int i = 0;
    		int j = 0;
     
    		for(Element url :urls)
    		{		
     
    			done = url.text(); 
    			if (done.length() > 2)
    			{
    				if(j < 7)
    				{	
    				date = done;
    				ar.add(date);
    				i = i+1;
    			//	System.out.println("\n la vérité <tr> " + date +"\n");
    				j = j+1;
    				}
    			}
    		//	System.out.println("\n Balise <tr> " + done +"\n"); 
     
    			}
    		for(int o = 0 ; o < ar.size(); o++){
    		 	String ma = ar.get(o);
    		 	System.out.println(ma);
    		 }
     
    		//System.out.println("\n la vérité <tr> " + date +"\n"); 
    		/*for(int j = 0; j < done.length ; j++ )
    		{
    			System.out.println( done[j] + "\n");
    		}*/
    		}catch(IOException e) 
    		{
     
    		}
     
    	}
    }
    le résultat marche bien car j'ai enregistré la pages résultat.php en test.html.

    Mais si je fait un test sur le navigateur(chrome ....) avec des résultats sur sur le page speedtest.net/results.php quand je lance mon parseur je reçois N/B sur tout les arguments.
    Donc je comprend bien la parseur se fait du coté serveur et pas du coté client .
    j'aimerais savoir s'il y a une méthode de parseur la page mais en se plassant du coté client .
    j'ai essayé de le faire en java en utilisabt jsoup ,json rien sa me fait la même chose avec le parseur php.

  2. #2
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    C'est pas un problème de parsing de la page, mais du fait que la page que renvoie le serveur ne contient pas les résultat. Les résultats sont ajoutés à la volée via du javascript par le navigateur. Du coup si tu veux parser ça, va falloir trouver un moyen d'interpréter correctement tout le javascript. Bonne chance

  3. #3
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Septembre 2013
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Septembre 2013
    Messages : 4
    Points : 4
    Points
    4
    Par défaut
    merci pour la réponse si qu’elle qu’un autre à des idées

Discussions similaires

  1. [XML] Parseur HTML en php
    Par bakhalils dans le forum Bibliothèques et frameworks
    Réponses: 0
    Dernier message: 28/03/2014, 11h41
  2. Integration de menu HTML/CSS avec PHP
    Par sparrow dans le forum Langage
    Réponses: 7
    Dernier message: 31/01/2006, 02h50
  3. Faire un parseur html
    Par titoff dans le forum Général JavaScript
    Réponses: 1
    Dernier message: 20/12/2005, 13h03
  4. Existe t-il un parseur HTML pou extraire des informations?
    Par danje dans le forum API standards et tierces
    Réponses: 1
    Dernier message: 31/10/2005, 11h55
  5. Cherche conseils pour livre HTML, JavaScript et PHP
    Par oodini dans le forum Général Conception Web
    Réponses: 1
    Dernier message: 16/10/2005, 15h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo