Bonjour,
Je souhaiterais parser une page web pour récupérer des données dessus. Or, je crois qu'il n'y a pas de xml dans le code de cette page. Avez vous une méthode ou une librarie à me conseiller ? Faut-il convertir le HTML en xml puis parser ou bien parser directement le HTML ?
Il est à noter que les informations qui m'interessent sont toutes dans des tableaux.
Quelqu'un a t-il déja utilisé ça ? : C++ HTML parser for QT, sachant que Qt sera déja présent dans mon projet pour la partie IHM.
Quid de Tidy ? J'arrive pas à savoir si ça permet de faire uniquement de la conversion/vérification ou si les données parsées sont exploitables autrement.
J'ai également cru comprendre que l'on pouvait parser à l'aide de gecko, le poteur de firefox. Pour ne pas alourdir l'application inutilement je me suis penché du coté de wekbit, intégré à qt. Est-il limité à l'affichage ou bien permet-il de récuperer les tableaux dans des variables par exemple ?
Merci
Partager