Bonjour,

Je cherche à récupérer le texte (avec une regex) contenu entre les balises <a href et img.

Par exemple, le code HTML suivant
Code : Sélectionner tout - Visualiser dans une fenêtre à part
... <a href="www.google.fr"><img src="www.google.fr/images"></a> ...
devrait me retourner ="www.google.fr" et src="www.google.fr/images", ce qui n'est pas le cas.

Bien sur je sais que le problème vient de ma regex, mais je n'arrive pas à en construire une correcte (malgré le cours de P. Plasserres).

Voici mon code actuel:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
Protected Sub parseHTML(ByRef HTML As String)
    Dim pattern As String = "[<a href]([^>]+)[><img ]([^>]+)[></a>]"
    Dim matches As MatchCollection = Regex.Matches(HTML, pattern)
    For Each match As Match In matches
        Debug.WriteLine("HREF " & match.Groups(1).Value)
        Debug.WriteLine("IMG " & match.Groups(2).Value)
    Next
End Sub
Toute aide sera la bienvenue. Merci par avance,

Furior