Bonjour,

Je cherche à récupérer les liens sur des images dans une page de résultats sur http://images.google.fr.

Voici le début de mon code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
        Dim HttpWResponse As HttpWebResponse = Nothing
        Dim sr As StreamReader = Nothing
        Dim sourcePage As String
        Try
            Dim url As New System.Text.StringBuilder
            url.Append("http://images.google.fr/images?q=stuff")
            url.Append("&svnum=10&um=1&hl=fr&imgsz=xxlarge")
            Dim HttpWRequest As HttpWebRequest = CType(WebRequest.Create(url.ToString), HttpWebRequest)
            HttpWResponse = CType(HttpWRequest.GetResponse, HttpWebResponse)
            sr = New StreamReader(HttpWResponse.GetResponseStream)
            sourcePage = sr.ReadToEnd
            sr.Close()
        Catch ex As Exception
            Console.WriteLine(ex.Message)
            Return Nothing
        End Try
A partir de là j'ai le code source de la page Web retournée dans sourcePage.

Mais je ne sais pas du tout par quel bout prendre le problème pour analyser la chaine et retrouver tous les http://url_de_mon_image.jpg enfouis dans le code HTML.

Quelqu'un aurait-il une suggestion ? Merci !