Bonsoir,
Je souhaiterais extraire des données depuis un fichier .HTML
par exemple:
...
<h1>Bonjour à Tous</h1>
...

=>Je souhaiterais afficher "Bonjour à Tous".
J'ai déjà essayé ,avec le code suivant:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
 public class extraction {
public static void main(String[] args) {
readFile("fichier.html");
}
public static void readFile(String pathToFile){
try {
BufferedReader reader = new BufferedReader(new FileReader(new File(pathToFile)));
String ligne;
while((ligne = reader.readLine()) != null){
if(ligne.endsWith("</h1>")){
System.out.println(ligne);
}
}
} catch (Exception ex){
System.err.println("Error. "+ex.getMessage());
}
}
}
=>le résultat affiché est: <h1>Bonjour à Tous</h1> or je veux éliminer les deux balises <h1> et </h1>.
merci d'avance