Récupérer toutes les occurences d'une regex ?
Bonjour,
Voilà mon code :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
|
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String codeHTML = getIpFrom("http://www.google.com");
Pattern regex_masque;
Matcher regex_resultat;
//System.out.println(codeHTML);
regex_masque = Pattern.compile("(<a.*href=[\"']([^\"]*)[\"'].*>)",Pattern.CASE_INSENSITIVE);
regex_resultat = regex_masque.matcher(codeHTML);
System.out.println("Nombre de résultat(s) : " + regex_resultat.groupCount());
while(regex_resultat.find()) {
System.out.println("Le texte : " + regex_resultat.group(1));
System.out.println("Le texte : " + regex_resultat.group(2));
}
}
catch(PatternSyntaxException e){}
} |
Je récupère dans un premier temps tout le code HTML d'une page, et je cherche à en extraire tous les liens hypertextes. Je vais bien avoir les résultats pour un lien par "ligne", mais si plusieurs liens sont dans une même "ligne" alors je n'ai que le dernier :?
Comment accéder à tous les autres ?
Exemple si ma chaine à analyser est "<a href='t1.php'>toto</a>blabla<a href='dd.html'>titi</a>" je veux récupèrer t1.php et dd.html, mais actuellement je n'ai que dd.html :(
Merci d'avance ;)