IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Probleme parsing site web


Sujet :

Java

  1. #1
    Membre confirmé
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2013
    Messages
    124
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Février 2013
    Messages : 124
    Par défaut Probleme parsing site web
    Hello les geeks ! ça code?

    J'ai un ptit programme java qui essaie de parser une page web à l'aide de JSoup.
    Mais j'ai un problème ça ne fonctionne pas comme d'habithude, je m'explique :
    Pour me parser la page comme d'habithude je fais :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    Document doc;
    doc=Jsoup.connect("http://www.xxx.com").get();
    System.out.println(doc.text());
    Le problème est que ce code m'affiche tout de la page web sauf ce dont j'ai besoin. Je présume que le site protège ses données contre le parsing html, pourtant les données que j'ai besoin sont bien présente à la lecture du HTML avec l'inspecteur d'element de mon google chrome.
    Donc je me demande comment le site fait-il pour se protéger, et bien sur comment récupérer quand même les données dont j'ai besoin

    Merci
    A+

    Dumbl

  2. #2
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Salut,

    C'est peut-être une page avec des parties générées dynamiquement, avec du javascript dans le onLoad(), voire des requêtes AJAX. JSOUP est un parser html, mais il n'exécute pas le javascript !
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  3. #3
    Membre confirmé
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2013
    Messages
    124
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Février 2013
    Messages : 124
    Par défaut
    Merci pour ta reponse.

    En effet je vois un <body onload="initiate()">

    Et plus bah un script avec une fonction qui semble à l'origine des données.
    Je vais donc regarder l'Ajax, je te tiens au courant.

Discussions similaires

  1. probleme reference site web asp net
    Par lamlam dans le forum ASP.NET
    Réponses: 0
    Dernier message: 28/04/2011, 18h50
  2. [CS3] Probleme visibilité site web
    Par mich mich dans le forum Dreamweaver
    Réponses: 0
    Dernier message: 09/09/2010, 10h50
  3. probleme hebergement site web
    Par itmak dans le forum Autres hébergeurs
    Réponses: 7
    Dernier message: 27/10/2007, 15h09
  4. probleme lenteur site web
    Par cutpeter56 dans le forum Langage
    Réponses: 10
    Dernier message: 16/06/2007, 03h57
  5. [2.0][IIS] Probleme de déploiment de site web
    Par batosai dans le forum IIS
    Réponses: 7
    Dernier message: 06/06/2006, 14h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo