Bonjour
J'ai une page XHTML assez complexe correspondant à une page web dans laquelle je souhaite extraire certaines données.
Par exemple j'ai une ligne du type
<div class="global_menu_name"><img src="images/f.png" /><a href="hhhhhhh">Prénom</a> <a href="ggggggg">Nom</a></div>
Mon but est de détecter cette ligne et d'en extraire les deux liens href, Prénom et Nom.
Je suis arrivé à lister les nœuds du type div avec mais il m'en manque, surtout celui que je recherche.
J'ai donc essayé d'utiliser Descendants avec le code suivant
1 2 3 4 5 6 7 8 9 10 11 12 13
| Function DécoderHTML(ByRef HtmlDoc As HtmlDocument) As Boolean
'Recherche de la balise html
Dim html As HtmlNode = HtmlDoc.DocumentNode.Element("html")
'recherche de la balise div class="global_menu_name"
Dim divTags As Object = HtmlDoc.DocumentNode.Descendants()
For Each tag As HtmlNode In divTags
If tag.Attributes("class") IsNot Nothing Then
If tag.Attributes("class").Value = "global-menu-name" Then
Console.WriteLine(tag.Attributes("class").Value)
Stop
End If
End If
Next |
Mais le code détecte bien des des "class" mais pas toutes.
Merci pour votre aide.
Partager