Capturer un <a></a> avec une regex

Salut

Je cherche à capturer le href d'un <a> ainsi que son contenu, mais je n'ai pas trouvé d'expression régulière qui me permettes d'exclure le </a>

Je m'explique

J'utilise l'expression régulière suivante :

Citation:

<a\s[^<>]*href="([^"<>]*)"[^<>]*>(.*)</a>

Je l'ai pas mis dans une balise code, car il s'agit là de l'expression régulière en elle même
Elle fonctionne sauf si j'ai 2 liens

C'est à dire que avec

Citation:

<a href="http://www.example.com"><img src="http://www.example.com/example.jpg" /></a>"

aucun problème, ma première variable capturée est :

Citation:

http://www.example.com

et ma deuxième variable capturée

Citation:

<img src="http://www.example.com/example.jpg" />

Seulement si il y a 2 liens, je capture uniquement le contenu entre le premier <a> et le dernier </a>

En gros avec

Citation:

<a href="http://www.example.com"><img src="http://www.example.com/example.jpg" /></a><a href="autrelien">autre texte</a>

je capture

Citation:

http://www.example.com

et

Citation:

<img src="http://www.example.com/example.jpg" /></a><a href="autrelien">autre texte

Une idée pour exclure les </a> de mes parenthèses ?

J'ai essayé pas mal de truc, mais je sais pas comment on exclut une expression (j'ai essayé ^(?:</a>) mais c'est pas ca :'( )

Salut.
Tu dois utiliser une expression reguliere avec un quantificateur non-gourmand.
Donc ton expression devient

Citation:

<a\s[^<>]*href="([^"<>]*)"[^<>]*>(.*?)</a>

Bon courage
;)

Tu peux utiliser quelquechose de ce genre :

Code:

<a.*?href="(?<href>.*?)"[\>]*>(?<contenu>.*?)</a>

Merci pour l'astuce ca fonctionne :D