Bonsoir tout le monde
Pouvez vous me donnez SVP une piste pour que je puisse développer un aspirateur de site en JAVA ?
Bonsoir tout le monde
Pouvez vous me donnez SVP une piste pour que je puisse développer un aspirateur de site en JAVA ?
Va falloir être plus précis sur ta question. Qu'est-ce qui te pose problème?
salut.
je pense que tu dois utiliser la classe HTMLDocument et la classe URL
Salut tout le monde
Ce que je voudrais faire c'est aspirer une page web et avoir son code source pour y appliquer un transformateur genre XSLT pour avoir les données dont j'ai besoin.
Merci à vous
tu peux essayer ce code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 URL url = new URL("http://................."); BufferedReader lire = new BufferedReader(new InputStreamReader(url.openStream())); String str; while ((str = lire.readLine()) != null) System.out.println(str); lire.close();
pour lire un url, il suffit d'utiliser l'objet URL, pour transformer le flux en un DOM, il y a les apis nekohtml et tinyHtml par exemple.
Merci pour vos réponses je vais tester vos proposition
Si tu as le courage de t'y plonger, il y a le projet java "Web Harvest" qui répond un peu à ton besoin.
Il permet de récupérer des pages web (donc HTML) qu'il va transformer en XML.
phantomass merci pour l'infos : Web Harvest
Par contre pour le courage je ne suis pas d'accord avec toi ce n'est pas le courage qui va me pousser ou pas à s'y plonger plutôt est ce que je vais combler mon besoin ou pas.
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager