Lecture et extraction d'une page Web
Bonjour
Je cherche à décoder une page web à l'aide du code suivant (en utilsant HtmlAgilityPack):
Code:
1 2 3 4
| Dim sUrl as String = "http://xxxxxx"
Dim Web As New HtmlWeb()
Dim HtmlDoc As HtmlDocument = Web.Load(SUrl)
HtmlDoc.Load(SUrl) |
L'exécution me renvoit une erreur "Le format URI n'est pas accepté"
J'ai donc utilisé le code suivant
Code:
1 2 3 4 5 6 7 8 9 10 11
| Dim uri As String = "http://xxxx"
Dim request As HttpWebRequest = DirectCast(WebRequest.Create(uri), HttpWebRequest)
request.Credentials = credentials
request.Timeout = 1 * 60 * 1000
Dim sContenu As String
Dim Doc As HtmlDocument
Using response As HttpWebResponse = DirectCast(request.GetResponse(), HttpWebResponse)
Using sr As New StreamReader(response.GetResponseStream())
sContenu = sr.ReadToEnd
End Using
End Using |
Cette fois-ci je n'ai plus d'erreur et j'obtiens bien le contenu dans le string sContenu
Mais je perd la possibilité d'en parcourir les noeuds.
Merci pour votre aide.
Bernard