Bonjour à tous,
J'ai un petit soucis avec l'utilisation des regex pour extraire quelques blocs d'une page HTML.
Cette page que je récupère liste plusieurs objets. Le code HTML les représentant est identique et à la forme suivante :
Récupérer l'URL 1 n'est pas un problème. Les autres aussi d'ailleurs.. Seulement, je n'arrive pas à récupérer toutes les valeurs qui m'intéressent d'un coup. C'est à dire que je n'arrive pas à créer ma regex de telle sorte de lui dire :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 <img src="URL_1_TO_PARSE" style...></a> ... Diverses balise HTML </tr> ... Diverses balise HTML <td nowrap="nowrap"> <a href="URL_2_TO_PARSE"> "TEXT_1_TO_PARSE"</a> <br> "TEXT_2_TO_PARSE"
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 <img src=\"(.*/thumbs/[0-9]*.jpg)\" // Get URL_1_TO_PARSE n'importe quoi JUSQUE <a href="MA_REGEX_POUR_URL_2_TO_PARSE
Je bloque sur le "n'importe quoi jusqu'une certaine chaîne". J'ai essayé [\w\s\S]*, mais il prend tous le reste du code avec cette regex (normale..).
Quelqu'un aurait une idée ?
Merci :-)
Partager