Problème d'extraction de données d'une page web
Bonjour
J'essaye d'extraire des données d'une page web dont l'adresse est
http://gw.geneanet.org/bernardbouree...ore&type=fiche
Pour cela j'ai enregistré sur mon disque la version en code source pour faire mes essais.
J'utilise sur base HtlmAgilityPack le code suivant:
Code:
1 2 3 4
| Dim Htmldoc As New HtmlDocument()
Dim Html = File.readAllText("FichierTest.html"
HtmlDoc.LoadHtml(Html)
Dim divId As HtmlNode = HtmlDoc.DocumentNode.SelectSingleNode("//div[@class='global-menu-name']") |
Le noeud div recherché
Par contre quand je lis la page directement avec
Code:
1 2 3 4
| Dim Htmldoc As New HtmlDocument()
Dim Web As New HtlmWeb()
Htmldoc = Web.Load("http://gw.geneanet.org/bernardbouree_w?n=bouree+de+poncey&oc=0&p=jean+baptiste+honore&type=fiche")
Dim divId As HtmlNode = HtmlDoc.DocumentNode.SelectSingleNode("//div[@class='global-menu-name']") |
La ligne de code divID renvoie un noeud vide.
Pourquoi cette différence de traitement ?
Merci pour votre aide
Bernard