Bonjour,
Actuellement je parse du HTML avec HTMLEditorKit.ParserCallback mais le pb c'est que ce parser ne supporte que du html v 3.2 avec quelques extensions.
Connaissez vous des parsers que supportent le HTML 4.0 et plus ?
NB : J' ai besoin du parser pour recuperer le texte contenu dans la page web sans les balises, pour cela j'ai juste imlemente la fct
[code]public void handleText(char[] data, int pos)[/cpode]
de HTMLEditorKit.ParserCallback.
Merci de votre aide .
Partager