Salut
Salut...
Cette méthode te renvoi un BufferedReader qui va lire le code de la page que tu lui passe en paramètre...
Après, a toi de traiter les lignes!
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 private BufferedReader connect(String url) { URL fileURL = null; URLConnection urlConnection = null; InputStream httpStream = null; BufferedReader in = null; try { fileURL = new URL(url); urlConnection = fileURL.openConnection(); httpStream = urlConnection.getInputStream(); in = new BufferedReader(new InputStreamReader(httpStream)); } catch (Exception ex) { ex.printStackTrace(); } return in; }
Moi perso, quand j'ai ce genre de traitement à faire, je traite les lignes une par une... et je récupère les infos que j'ai besoin au fur et a mesure que la page est lue...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 while ((line = br.readLine()) != null) { // ... traitement des lignes lues ... }
En espérant que ça t'aide...
++
Pour lire un fichier en local ou depuis une URL, classique type "http://" pas de problème.
Ce qui te faut est dispo dans l'API Java. (classe URL de java.net)
Pour le parsing, il y a plusieurs solutions:
- Si tu veux faire quelquechose de simple et approximatif, les expressions régulières peuvent convenir.
Tout est dispo das l'API Java (classe Pattern et Matcher de java.util.regex)
- Si tu veux un parsing bien fait et que tes fichiers sont en xhtml bien formé, tu peux utiliser un parseur XML.
La encore dispo dans l'API Java (pakage javax.xml.parsers)
- Si tes fichiers sont en html, l'API java ne gérant pas le parsing html, il te faudra un parseur HTML en tant que bibliothèque externe.
Partager