-
HTMLCXX & Parsing HTML
Salut
J'aimerai extraire de pages web au format html, des URL qui y seraient présentes. J'ai trouvé un parser d' html : HTMLCXX
http://htmlcxx.sourceforge.net/
Est ce que qqun. l'aurai déjà utilisé ? De mon coté, je n'arrive pas à compiler l'exemple du lien
Sinon auriez vous, s'il vous plait, une autre méthode pour parser de l'html en C++ afin de récupérer des URL contenues dans une page Web ?
Merci d'avance
-
Salut,
Faire simplement une recherche sur href=" puis le " de fin suivant ne suffit pas ?
MAT.