IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

Exploiter les balises dans page web


Sujet :

Langage Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre très actif
    Profil pro
    Inscrit en
    Juillet 2013
    Messages
    299
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2013
    Messages : 299
    Par défaut Exploiter les balises dans page web
    Hello,
    j'ai une page sur laquelle s'affiche aléatoirement des numéros. Je dois les récupérer à partir de la page web. Je ne peux rien savoir à l'avance !
    Je sais seulement que le numéro sera dans cet attribut tel que par exemple :

    Code java : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
        <div class=
        "sk-content-text sk-document-accestype-audiotel sk-document-country-fr sk-document-id-213327"
        id="sk-access-type-body-audiotel" style="">
            <span class="text1" id="sk-send-text-audiotel">Téléphonez au</span>
            <span class="sk-country-flag-fr" id=
            "sk-country-image-audiotel">&nbsp;</span> <span class="bigtext" id=
            "sk-audiotel-phone-number">0899000000</span>
     
            <div class="sk-call-price">
                <span class="sk-price-tagline"><span id=
                "sk-audiotel-fixed-cost-detail">1 €</span> <span id=
                "sk-price-per-call" style="">TTC/appel</span> <span id=
                "sk-audiotel-variable-cost-detail">+ 0.5 €</span> <span id=
                "sk-price-per-minute" style="">TTC/minute</span> <span id=
                "sk-audiotel-extra-text1" style="display: none;">depuis une ligne
                fixe</span> <span>-</span></span> <span id=
                "sk-audiotel-after-detail-text">Seul le coût de la communication
                vous sera facturé.</span>
            </div>
        </div>

    Je dois donc .... en java..... exploiter la page web pour avoir le numéro de téléphone uniquement mais selon le pays, et le type (appel/sms) !
    Bon à savoir : il y a plusieurs DIV comme celles là, et je connais les ID par avance, je connais pas les numéros c'est tout.

    Des pistes :
    Je sais que je devrais get le content de la page, puis chercher les ID dans la string obtenue. Après je sais pas si je peux plutôt choper directement dans les balises... ?

    Aidez-moi s'il vous plait

  2. #2
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Salut,

    Le plus simple est d'utiliser un parseur de html, comme jsoup, par exemple.
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  3. #3
    Membre très actif
    Profil pro
    Inscrit en
    Juillet 2013
    Messages
    299
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2013
    Messages : 299
    Par défaut
    Citation Envoyé par joel.drigo Voir le message
    Salut,
    Le plus simple est d'utiliser un parseur de html, comme jsoup, par exemple.
    Merci beaucoup,
    Je souhaite une précision, ça ne pose pas de problème que le code que j'ai envoyé ci-dessus ne soit pas directement écrit dans la page ?
    Ma page contient ceci :
    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    <html><head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
    <link href="style.css" type="text/css" rel="stylesheet">
    <title>MeCraft</title>
    </head>
    <center><div class="head">PAGE PRIVÉE !</div>
    <br><br><br>
    <div id="xxx"></div><script type="text/javascript" src="http://xxx/script.php?idd=xxx&amp;verif_en_php=1&amp;datas="></script><noscript>Veuillez activer le Javascript de votre navigateur s'il vous pla&icirc;t.<br /><a href="http://xxx/">x</a></noscript>
    </body></html>
    Et quand on va sur la page, alors il s'affiche une boite avec plein de trucs.

    En bref ça ressemble au système de l'iframe !
    Ça marche quand même ?

  4. #4
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Ah, si, là ça va poser un problème avec JSoup, car le dom du document html est modifié dynamiquement par un script javaScript. Ensuite, il faut simuler ce qu'il faut pour déclencher l'exécution du script : là, à priori, il s'exécute tout seul (pas besoin de cliquer quelquechose ou de saisir des infos, etc...).

    Il existe un browser headless appelé HtmlUnit qui pourrait peut-être te permettre de résoudre ton problème : je n'ai jamais essayé personnellement, donc je ne peux te garantir. A toi d'essayer, et de me dire si ça fonctionne avec ton site.
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  5. #5
    Membre très actif
    Profil pro
    Inscrit en
    Juillet 2013
    Messages
    299
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2013
    Messages : 299
    Par défaut
    Citation Envoyé par joel.drigo Voir le message
    Ah, si, là ça va poser un problème avec JSoup, car le dom du document html est modifié dynamiquement par un script javaScript. Ensuite, il faut simuler ce qu'il faut pour déclencher l'exécution du script : là, à priori, il s'exécute tout seul (pas besoin de cliquer quelquechose ou de saisir des infos, etc...).
    Il existe un browser headless appelé HtmlUnit qui pourrait peut-être te permettre de résoudre ton problème : je n'ai jamais essayé personnellement, donc je ne peux te garantir. A toi d'essayer, et de me dire si ça fonctionne avec ton site.
    Ah bah merci beaucoup
    je vais tester !

    Donc par exemple je peux faire ça ?
    Code java : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
        WebClient webClient = new WebClient();
        Page page = webClient.getPage("http://example.com");
        WebResponse response = page.getWebResponse();
        String content = response.getContentAsString();

    Et je peux insérer ça ?
    Code java : Sélectionner tout - Visualiser dans une fenêtre à part
    Elements numero = doc.select("#sk-access-type-body-audiotel.sk-document-country-fr");

  6. #6
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Je pense qui'il faut plutôt faire :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    final WebClient webClient = new WebClient();
    final HtmlPage page = webClient.getPage("http://exemple.com");
    Ensuite,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    DomElement element =  page.getElementById("sk-audiotel-phone-number");
    element représente donc le SPAN d'id "sk-audiotel-phone-number", et est de classe org.w3c.dom.Element : tu peux donc le parcourir afin de récupérer les sous-éléments, attributs et contenu texte, par getTextContent(). (voir tutoriel ici).
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

Discussions similaires

  1. Récupérer les données d’une page web et les incorporer dans un tableau
    Par miss_ana dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 26/05/2014, 11h16
  2. [PDF] Ouvrir des fichiers PDF dans page Web
    Par ludoweb dans le forum Bibliothèques et frameworks
    Réponses: 12
    Dernier message: 07/09/2006, 08h13
  3. [ActiveX] Message de sécurité dans page Web
    Par Mescalito dans le forum MFC
    Réponses: 3
    Dernier message: 21/02/2006, 16h15
  4. Pb activation module quicktime dans page web
    Par Adry dans le forum Balisage (X)HTML et validation W3C
    Réponses: 1
    Dernier message: 05/12/2005, 14h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo