expression réguliere java
Bonjour à tous et toute. Je réalise un petit parser (un parser light dirons nous) qui me parse donc du HTML.
Je réalise ce parser en utilisant des expressions régulieres.
J'en arrive à ma question :
Lorsque j'ai la source suivante :
Code:
1 2
|
<DIV STYLE="position:absolute; visibility:hidden; left:0; top:0; width:0; height:0;"> [<a href='./pages/03alhomepag.html'></a>] [<a href='http://www.lmsoft.com/'>Web Creator</a>] [<a href='http://www.lmsoft.com/'>LMSOFT</a>] </DIV> |
et mon expression réguliere suivante :
Code:
1 2
|
(?i)<a.*href=(\"|'){1}([^\"]*)(\"|'){1}[^>]* |
qui me sers donc a récuperer tous les liens..
Lorsque je l'execute, je ne recupere qu'une seule entité (récupération du matcher.group(2):
Code:
1 2 3 4
|
http://www.matec-sa.com/pages/03alhomepag.html'></a>]
[<a%20href='http://www.lmsoft.com/'>Web%20Creator</a>]
[<a%20href='http://www.lmsoft.com/ |
Je ne récupère qu'une seule entite au lieu de 3 :
./pages/03alhomepag.html
http://www.lmsoft.com/
http://www.lmsoft.com/
Quelqu'un a t'il une idée pour me dépatouiller?