Capturer un <a></a> avec une regex
Salut
Je cherche à capturer le href d'un <a> ainsi que son contenu, mais je n'ai pas trouvé d'expression régulière qui me permettes d'exclure le </a>
Je m'explique
J'utilise l'expression régulière suivante :
Citation:
<a\s[^<>]*href="([^"<>]*)"[^<>]*>(.*)</a>
Je l'ai pas mis dans une balise code, car il s'agit là de l'expression régulière en elle même
Elle fonctionne sauf si j'ai 2 liens
C'est à dire que avec
Citation:
<a href="http://www.example.com"><img src="http://www.example.com/example.jpg" /></a>"
aucun problème, ma première variable capturée est :
et ma deuxième variable capturée
Citation:
<img src="http://www.example.com/example.jpg" />
Seulement si il y a 2 liens, je capture uniquement le contenu entre le premier <a> et le dernier </a>
En gros avec
Citation:
<a href="http://www.example.com"><img src="http://www.example.com/example.jpg" /></a><a href="autrelien">autre texte</a>
je capture
et
Citation:
<img src="http://www.example.com/example.jpg" /></a><a href="autrelien">autre texte
Une idée pour exclure les </a> de mes parenthèses ?
J'ai essayé pas mal de truc, mais je sais pas comment on exclut une expression (j'ai essayé ^(?:</a>) mais c'est pas ca :'( )