Bonjour à tous,
Je cherche un moyen efficace de parser du code HTML afin de récupérer des informations et parser des balises spécifiques. J'ai fais beaucoup de recherches, mais ça parle surtout du parsing de fichier XML que je maîtrise déjà.
Connaissez vous un bon moyens, une bonne lib capable de m'aider à réaliser un parser sur n'importe qu'elle code html même avec des balises non fermés ? Car je connaît Libxml, html tidy et tous le reste mais je ne sais pas si ces libs sont capables de parser correctement du HTML ver 4.0 voir plus.
Je cherche un moyen vraiment professionnel et qui ne génère pas d'erreur.
Merci d'avance.
Partager