Bonjour,
je suis débutante en java. j'aimerais savoir comment manipuler un fichier html avec java.
ouvrir la source et extraire les parties qui se trouve entre les body.
merci
Version imprimable
Bonjour,
je suis débutante en java. j'aimerais savoir comment manipuler un fichier html avec java.
ouvrir la source et extraire les parties qui se trouve entre les body.
merci
Vous pouvez bien sûr analyser ligne par ligne le fichier html avec les api java.util.regex, mais moi je commencerais une recherche google "java parser html" pour connaitre les libs java qui peuvent faciliter le travail.
Bonjour,
Je ne vois pas pourquoi on analyserait une page html en java... :roll:
Quel est le besoin ?
Tu veux peut etre faire communiquer le serveur et le client (web) ?
Peux-tu nous expliquer votre besoin? comme ça on peut mieux t'aider, te proposer de meilleurs alternatives que celle-ci.
bonjour,
je veux lire l'index des pages web en java
Tu peux peut être utiliser http://jsoup.org/
Les frameworks comme JSoup ou NekoHTML sont très bien pour ça car ils permettent de parser en format XML des pages HTML qui ne sont pas forcément bien formattées.
En gros ils font pareil qu'un navigateur: si il manque certains tags HTML c'est pas grave ils essaient de faire au mieux et vont de petits ajustements.
Les autres parseurs sont beaucoup plus strictes (Dom4J etc) et lèveront une exception à la moindre occasion.
A partir du moment ou ton doc est parsé en XML, tu peux utiliser XPath qui permet de facilement te positionner sur un noeud XML pour en extraire son contenu.