Bonsoir tout le monde
Pouvez vous me donnez SVP une piste pour que je puisse développer un aspirateur de site en JAVA ?
Version imprimable
Bonsoir tout le monde
Pouvez vous me donnez SVP une piste pour que je puisse développer un aspirateur de site en JAVA ?
Va falloir être plus précis sur ta question. Qu'est-ce qui te pose problème?
salut.
je pense que tu dois utiliser la classe HTMLDocument et la classe URL
Salut tout le monde
Ce que je voudrais faire c'est aspirer une page web et avoir son code source pour y appliquer un transformateur genre XSLT pour avoir les données dont j'ai besoin.
Merci à vous
pour lire un url, il suffit d'utiliser l'objet URL, pour transformer le flux en un DOM, il y a les apis nekohtml et tinyHtml par exemple.
Merci pour vos réponses je vais tester vos proposition
Si tu as le courage de t'y plonger, il y a le projet java "Web Harvest" qui répond un peu à ton besoin.
Il permet de récupérer des pages web (donc HTML) qu'il va transformer en XML.
phantomass merci pour l'infos : Web Harvest
Par contre pour le courage je ne suis pas d'accord avec toi ce n'est pas le courage qui va me pousser ou pas à s'y plonger plutôt est ce que je vais combler mon besoin ou pas.