IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement Web en Java Discussion :

Récupérer des données d'une page Web


Sujet :

Développement Web en Java

  1. #1
    Invité
    Invité(e)
    Par défaut Récupérer des données d'une page Web
    Bonjour,

    J'ai un petit projet perso ou j'aimerai récupérer des infos sur un site web : https://www.windguru.cz/49287

    Donc j'ai commencé à chercher comment récupérer le code source pour ensuite le traiter j'ai donc trouvé ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    HttpURLConnection conn = (HttpURLConnection) new URL(
                    "https://www.windguru.cz/49287").openConnection();
            conn.connect();
     
            BufferedInputStream bis = new BufferedInputStream(conn.getInputStream());
     
            byte[] bytes = new byte[1024];
            int tmp ;
            while( (tmp = bis.read(bytes) ) != -1 ) {
                String chaine = new String(bytes,0,tmp);
                System.out.print(chaine);
            }
    Bon, ça marche je récupère un code source, sauf que mes données n'y sont pas. Je n'y connais absolument rien en html et php, mais grâce au petit utilitaire qu'on ouvre en appuyant sur ctrl+maj+i quand on est sur une page, j'ai pu voir qu'il existait tout plein de lignes en plus.
    Ainsi j'ai pu retrouver les données (c'est les valeurs numériques dans les tableaux). Comme ça fait beaucoup d'écriture je met des screenshots

    On voit ici la partie qui m'intéresse avec le lien en bleu entre la page visuel et le code source, je peux la voir avec mon navigateur.

    Nom : Capture.PNG
Affichages : 3040
Taille : 173,5 Ko


    Nom : Capture2.PNG
Affichages : 2634
Taille : 41,9 Ko

    Et là le code que je récupère en vrai, où il n'y a pas ce que je veux !

    Du coup je pense bien qu'il y a quelques chose qui ne va pas dans ce que je récupère, mais quoi ? Pouvez-vous m'aidez s'il vous-plait ? Merci d'avance.

  2. #2
    Membre expérimenté Avatar de Cincinnatus
    Homme Profil pro
    Développeur d'applications métier
    Inscrit en
    Mars 2007
    Messages
    592
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Développeur d'applications métier
    Secteur : Service public

    Informations forums :
    Inscription : Mars 2007
    Messages : 592
    Points : 1 679
    Points
    1 679
    Par défaut
    Bonjour,

    Il existe quantité de techniques pour récupérer des contenus de page web. Une liste se trouve ici : http://zetcode.com/articles/javareadwebpage/

    La page que tu indiques semble être en grande partie générée dynamiquement. Le fait de récupérer le HTML à cette url ne donne pas l'ensemble de la page. Il faut générer la partie dynamique et ensuite lire les infos utiles.
    HtmlUnit est un bon outil pour ça, puisqu'il simule un navigateur. Un premier tutoriel se trouve ici : http://htmlunit.sourceforge.net/gettingStarted.html


    Citation Envoyé par Gorman.exe Voir le message
    Je n'y connais absolument rien en html et php
    Un conseil : commence par apprendre comment les pages sont structurées, car sinon comment analyser leur contenu ?
    j-willette.developpez.com/tutoriels/html/les-bases-du-html
    https://xhtml.developpez.com/cours/

  3. #3
    Invité
    Invité(e)
    Par défaut
    Merci à toi, je me doutais bien qu'il faut apprendre comment elles sont structurées, après je comprends plus ou moins quelques trucs. En fait ce qui m'embêtais le plus dans cette page, c'est qu'avant cette partie n'était pas en dynamique, du coup, bien plus facile à récupérer.

    Je vais m'atteler à regarder ce que tu m'as envoyé, je reviendrai peut-être une fois mes connaissances un peu approfondies.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2010] Récupérer des données d'une page web entre 2 balises imbriquées
    Par SkyCorp dans le forum Macros et VBA Excel
    Réponses: 17
    Dernier message: 15/10/2015, 02h31
  2. Récupérer des données d'une page web
    Par danyII dans le forum Langage
    Réponses: 2
    Dernier message: 19/03/2008, 11h31
  3. Envoyer des données POST à une page web puis récupérer l'URL
    Par Ze moi dans le forum Shell et commandes GNU
    Réponses: 3
    Dernier message: 23/04/2007, 17h18
  4. [RegEx] Récupérer des données dans une page Web
    Par Pragmateek dans le forum Langage
    Réponses: 8
    Dernier message: 24/05/2006, 19h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo