Extraction du contenu d'un URL
Bonsoir à tous,
Je cherche une méthode pour extraire le contenu d'une page web. Ce que je cherche est d'extraire le contenu d'un article de presse (CNNou autre)
J'ai essayé d'exploiter l'api jsoup mais malheureusement sans vain !!
Voila le code que j'ai essayé
Code:
1 2 3 4 5 6
|
Document document = Jsoup.connect("http://edition.cnn.com/2013/11/10/world/asia/philippines-typhoon-haiyan/index.html").get();
Element contents = document.select("#content").first();
System.out.println(contents.html());
System.out.println(contents.text()); |
mais voila qu'est ce que j'ai eu :
Code:
1 2 3
|
Exception in thread "main" java.lang.NullPointerException
at com.clearforest.Test.main(Test.java:36) |
la ligne 36 correspond à l'instruction System.out.println(contents.html());
Toute info sera le bien venue et merci d'avance