Salut les amis(es)
Existe-t-il une méthode java qui parcourt les pages d’un site pour effectuer une extraction du texte a partir de toutes les pages de site.
Merci d’avance
Salut les amis(es)
Existe-t-il une méthode java qui parcourt les pages d’un site pour effectuer une extraction du texte a partir de toutes les pages de site.
Merci d’avance
Hello,
Je suis pas certain d'avoir compris exactement ce que tu voulais, mais ça me parait beaucoup pour une seule méthode java. En revanche, des bibliothèques qui font ça existent, comme ici
String fetchTextFromAllVisibleSameSitePagesFromUrl(URL url) ?
Non, 'y a pas.
Par contre il y a des bibliothèques fournissant plusieurs méthodes, qui, appelées intelligemment, permettent d'obtenir ce résultat.
Des crawlers c'est probablement le plus simple, en effet.
Tout ce dont tu as besoin ce trouve ici :
http://download.oracle.com/javase/1....a/net/URL.html
Partager