IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Faire un parsing "rapide" sur le code source html de www.break.com


Sujet :

Java

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2007
    Messages : 2
    Points : 2
    Points
    2
    Par défaut Faire un parsing "rapide" sur le code source html de www.break.com
    Bonjour,

    Je cherche a faire un parsing sur du code source html d'un site de type You Tube, pour recuperer 5/6 infos relatives a une video postee sur le site ( commentaires, rating, date du post).

    Je peux consacrer 3/4 jours au parsing, donc je pense au'il vaut mieux utiliser les fonctions java de type parseInt, parseChar, parseLong etc..

    Quelqu'un pourrait-il m'indiquer la methodologie a suivre?

    Merci d'avance

  2. #2
    Expert éminent sénior
    Avatar de Baptiste Wicht
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2005
    Messages
    7 431
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 7 431
    Points : 21 324
    Points
    21 324
    Par défaut
    Tu peux regarder ici comment récupérer l'entier du code d'une page web : http://baptiste-wicht.developpez.com...e=I#viewSource

    Ensuite, si tu ne veux pas tout, il suffit de chercher ce que tu veux avec le Scanner et d'utiliser des nextXXX pour récupérer ce que tu veux. Ou alors, tu travailles directement sur la chaine de caractères.

  3. #3
    Membre chevronné Avatar de Mister Nono
    Homme Profil pro
    Ingénieur Mathématiques et Informatique
    Inscrit en
    Septembre 2002
    Messages
    2 232
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur Mathématiques et Informatique
    Secteur : Santé

    Informations forums :
    Inscription : Septembre 2002
    Messages : 2 232
    Points : 1 897
    Points
    1 897
    Par défaut
    Il existe aussi les expressions régulières que tu peux utiliser avec la classe Scanner.

    A+
    La connaissance ne sert que si elle est partagée.
    http://ms2i.net

  4. #4
    Membre éprouvé
    Avatar de Sivrît
    Profil pro
    Inscrit en
    Février 2006
    Messages
    953
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2006
    Messages : 953
    Points : 1 249
    Points
    1 249
    Par défaut
    Si le html est "sain", XPath devrait être très efficace (du moins en terme de vitesse de développement), surtout si les info sont repérables grace à un style ou autre. Et (en google express) on doit avoir ça sans lib exotique :
    http://www-128.ibm.com/developerwork...axpathapi.html

Discussions similaires

  1. Demande d'aide sur un code source
    Par Soward dans le forum SDL
    Réponses: 3
    Dernier message: 13/06/2007, 20h22
  2. erreur sur un code source basique
    Par helix_tp dans le forum Langage
    Réponses: 4
    Dernier message: 23/01/2006, 21h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo