Bonjour,
J'essaye de réaliser une méthode pour isoler des fragments de code HTML, en utilisant les expressions régulières (javax.regex.Pattern)
Exemple tout bête : je voudrais isoler les balises A sur le fragment :
1 2 3 4 5 6 7 8 9
| <a href="www.google.fr">
google
</a>
<p>
Blah blah blah
</p>
<a href="www.exalead.com">
exalead
</a> |
J'ai essayé l'expression régulière
Pattern p = Pattern.compile("<a[\\s]+[^>]*>.*</a>");
Le problème est que le résultat part de la balise ouvrante google , et se termine à la balise fermante exalead...
Comment peut-on préciser au Pattern de ne pas capturer de balise fermante </a> ?
J'ai bien essayé celle ci, mais cela ne marche pas ...
Pattern p = Pattern.compile("<a[\\s]+[^>]*>[^(</a>)]*</a>");
Autre question : J'ai essayé ma première expression régulière avec DreamWeaver et Notepad++ , lesquels me renvoient une absence de résultat.
=> Est-ce Java qui ne respecte pas la norme POSIX ?
Partager