IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

avec Java Discussion :

Extraction des données Web


Sujet :

avec Java

  1. #1
    Invité
    Invité(e)
    Par défaut Extraction des données Web
    Bonjour tout le monde,

    Je suis en train de réaliser un projet qui consiste tout d'abored à extraire des données d'une page web et filtrer les informations qu'on a besoin, j'ai googlé un peu et j'ai trouvé pleines d'outils comme Regex et Jsoup, mais je ne sais pas comment faire surtout la partie de filtrer les données et enlever les balises HTML.

    Est ce que vous pouvez m'aider à ce point??

    Merci d'avance.


  2. #2
    Modérateur
    Avatar de kolodz
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2008
    Messages
    2 211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 211
    Points : 8 316
    Points
    8 316
    Billets dans le blog
    52
    Par défaut
    Google est ton ami !

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    public static String html2text(String html) {
        return Jsoup.parse(html).text();
    }
    Cordialement,
    Patrick kolodziejczyk.
    Si une réponse vous a été utile pensez à
    Si vous avez eu la réponse à votre question, marquez votre discussion
    Pensez aux FAQs et aux tutoriels et cours.

  3. #3
    Invité
    Invité(e)
    Par défaut
    Merci pour votre réponse, mais ça n'a pas marché, puisque le site est développé en ASP, du coup tout ce qui est entre guillemets est enlevé = toute la page

  4. #4
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    What ? Peu importe le langage serveur, les navigateurs ne lisent que le langage HTML.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  5. #5
    Invité
    Invité(e)
    Par défaut
    Citation Envoyé par thelvin Voir le message
    What ? Peu importe le langage serveur, les navigateurs ne lisent que le langage HTML.
    Tout d'abord je vous remercie pour votre réponse, bon, le contenu que je veux extraire est situé entre 2 balises <script>

    et voila le lien de la page que je veux extraire http://www.goalzz.com/main.aspx?c=9162&stage=1&sch=true

    Si vous avez une idée comment le faire, je serai très content de vous entendre

  6. #6
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    Ho le site pourri en javascript

    Bonne merde, tu va galérer sur un truc pareil ^^

  7. #7
    Invité
    Invité(e)
    Par défaut
    Citation Envoyé par tchize_ Voir le message
    Ho le site pourri en javascript

    Bonne merde, tu va galérer sur un truc pareil ^^
    C'est ça le problème, en fait, je vais créer un programme qui va extraire ces données à l'aide des Strokenizer et des split tant que le code de la page est bien structuré ^^

    Merci pour votre passage

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2007] Web Service SOAP Fichier WSDL / Extraction des données dans un classeur
    Par crusaders dans le forum Macros et VBA Excel
    Réponses: 0
    Dernier message: 08/12/2014, 12h05
  2. vc++(6)+extraction des données dans une image(.tif)
    Par spootnic22 dans le forum Visual C++
    Réponses: 1
    Dernier message: 22/11/2006, 16h14
  3. [MySQL] Problème de Charset à l'extraction des données
    Par naoufal01 dans le forum PHP & Base de données
    Réponses: 3
    Dernier message: 06/11/2006, 13h14
  4. extraction des données dans une table Access
    Par moabomotal dans le forum Access
    Réponses: 2
    Dernier message: 26/05/2006, 11h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo