Bonjour,

J'essaye de réaliser une méthode pour isoler des fragments de code HTML, en utilisant les expressions régulières (javax.regex.Pattern)

Exemple tout bête : je voudrais isoler les balises A sur le fragment :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
<a href="www.google.fr">
  google
</a>
<p>
  Blah blah blah
</p>
<a href="www.exalead.com">
  exalead
</a>
J'ai essayé l'expression régulière
Code : Sélectionner tout - Visualiser dans une fenêtre à part
Pattern p = Pattern.compile("<a[\\s]+[^>]*>.*</a>");
Le problème est que le résultat part de la balise ouvrante google , et se termine à la balise fermante exalead...

Comment peut-on préciser au Pattern de ne pas capturer de balise fermante </a> ?
J'ai bien essayé celle ci, mais cela ne marche pas ...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
Pattern p = Pattern.compile("<a[\\s]+[^>]*>[^(</a>)]*</a>");

Autre question : J'ai essayé ma première expression régulière avec DreamWeaver et Notepad++ , lesquels me renvoient une absence de résultat.

=> Est-ce Java qui ne respecte pas la norme POSIX ?