[Parser HTML] quel parser utiliser pour du HTML 4.0 ?
Bonjour,
Actuellement je parse du HTML avec HTMLEditorKit.ParserCallback mais le pb c'est que ce parser ne supporte que du html v 3.2 avec quelques extensions.
Connaissez vous des parsers que supportent le HTML 4.0 et plus ?
NB : J' ai besoin du parser pour recuperer le texte contenu dans la page web sans les balises, pour cela j'ai juste imlemente la fct
[code]public void handleText(char[] data, int pos)[/cpode]
de HTMLEditorKit.ParserCallback.
Merci de votre aide :D .
Passer l'authentification web.
Bonjour,
Merci deja pour ce parseur tres interressent.
J'aurais une autre question, y'aurait il un moyen de justement lire le code d'une page web, mais apres avoir passer une authentification ?
Actuellement j'arrive a m'authentifier directement a partir du logiciel, mais en lancant simplement une page web avec du code javascript pour lancer le formulaire avec les bons identifiants, et j'arrive sur la bonne page que je veux parser.
Comment faire pour obtenir cette page directement par programmation ?