Bonjour, je ne sais pas si je suis dans le bon forum. Si c'est pas le cas quelqu'un peut me rediriger.
Voilà mon problème: J'ai une chaine de caracteres contenant du html (récupéré sur un webBrowser), je veux ensuite analyser cette chaine de caracteres afin d'en extraire les liens hypertext qui y trouvent.
Je m'explique plus clairement: Dans mon projet asp.net, j'ai un webBrowser qui me permet d'ouvrir une page web et moi je recupere le code html de la page comme ceci
.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 private void button1_Click(object sender, EventArgs e) { HtmlElement element = null; string body = ""; foreach (var c in webBrowser1.Document.All) { element = c as HtmlElement; if (element.InnerHtml != null && element.InnerHtml.Contains("body")) { body = element.InnerHtml; ; break; } } //Mrethode qui me permet d'extraire les liens extraire_liens(body); }
Maintenant, mon idée c'est de recupérer tous les liens hypertext qui se trouvent dans ce code dans la méthode extraire_liens(string). Ce qui me complique c'est que ce code est de type string. Alors comment pourrais-je appliquer le js sur un string contenant du html pour en extraire toutes les balises <a>?
Partager