salut à tous,

ce que je voudrais, c'est extraire tous les liens d'une page html (balise <a href ..>).... mais on obtient pas toujours ce qu'on veut

j'ai d'abord essayé ceci
Code : Sélectionner tout - Visualiser dans une fenêtre à part
Pattern.compile(".*?<a\\s+href\\s*=\\s*[\"']?([^\"'>]*?)[\"']?>.*?");
cela marche bien, mais cette expression rate par exp les liens qui sont ainsi
Code : Sélectionner tout - Visualiser dans une fenêtre à part
<a href="http://site.com" title="titre" target="_blank">
donc j'ai essayé ceci
Code : Sélectionner tout - Visualiser dans une fenêtre à part
Pattern.compile(".*?<a\\s+href\\s*=\\s*[\"']?([^\"'>]*?)[\"']?[^>]*>.*?");
sans succès
et cela aussi sans succès
Code : Sélectionner tout - Visualiser dans une fenêtre à part
Pattern.compile(".*?<a\\s+href\\s*=\\s*[\"']?([^\"'>]*?)[\"']?.*?>.*?");
si quelqu'un a une idée