Bonjour à tous,
j'ai un petit soucis avec le parsing d'une page HTML.
J'utilise les libs HtmlAgilityPack afin de charger la page html et de creer un Navigator. Ensuite, j'utilise la lib Xpath... mais j'ai un problème à l’exécution du programme.
j'ai ce message d'erreur :
La référence d'objet n'est pas définie à une instance d'un objet.
Ci-dessous mon code :
ci-dessous l'adresse que j'utilise pour mes tests :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27 Imports HtmlAgilityPack Imports System.Xml.XPath Public Class htmlParser Public Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click Dim web As New HtmlWeb Dim url As String = "http://www.bfmtv.com/economie/entreprise/" ' load du document html Dim doc As HtmlDocument = web.Load(url) ' Selection des nodes XPATH Dim MesNodes As HtmlNodeNavigator = doc.DocumentNode.CreateNavigator Dim xmlNodeIterator As XPathNodeIterator = MesNodes.Select("//div[@class='article_item']") Dim toto As String While xmlNodeIterator.MoveNext() ' la ligne ce dessous me génére l'erreur... toto = xmlNodeIterator.Current.SelectSingleNode("rub").Value RichTextBox1.Text &= "----------____________----------" & vbCrLf RichTextBox1.Text &= toto End While end sub End class
http://www.bfmtv.com/economie/entreprise/
Si qlq un à une idée, Merci
Patrick








Répondre avec citation
Partager