Bonjour à tous et toute. Je réalise un petit parser (un parser light dirons nous) qui me parse donc du HTML.
Je réalise ce parser en utilisant des expressions régulieres.
J'en arrive à ma question :
Lorsque j'ai la source suivante :
et mon expression réguliere suivante :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 <DIV STYLE="position:absolute; visibility:hidden; left:0; top:0; width:0; height:0;"> [<a href='./pages/03alhomepag.html'></a>] [<a href='http://www.lmsoft.com/'>Web Creator</a>] [<a href='http://www.lmsoft.com/'>LMSOFT</a>] </DIV>
qui me sers donc a récuperer tous les liens..
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 (?i)<a.*href=(\"|'){1}([^\"]*)(\"|'){1}[^>]*
Lorsque je l'execute, je ne recupere qu'une seule entité (récupération du matcher.group(2):
Je ne récupère qu'une seule entite au lieu de 3 :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 http://www.matec-sa.com/pages/03alhomepag.html'></a>] [<a%20href='http://www.lmsoft.com/'>Web%20Creator</a>] [<a%20href='http://www.lmsoft.com/
./pages/03alhomepag.html
http://www.lmsoft.com/
http://www.lmsoft.com/
Quelqu'un a t'il une idée pour me dépatouiller?
Partager