Bonjour,

J'aimerais pouvoir analyser le contenu d'une page html automatiquement. Cette page se trouve à l'adresse http://www.toto.fr/page.php?id=xx
Je me demande quelle méthode utiliser... :
- est-ce possible de parser directement ce document ou faut-il l'enregistrer sur le disque dur ?
- dois-je utiliser DocumentParser ?

merci
le daoud

edit : infos supplémentaires : le document html en question contient beaucoup de tableaux, sans attribut id, et parmis les nombreux <table> il y en a qui contiennent de l'info qui m'intéresse, et je dois donc analyser les <td>.