Aide à extraire un bloc d'un code HTML/XML
Bonjour,
J'utilise Web-Harvest pour récupérer des données à partir de sites web, le logiciel transforme les pages webs en xml et se base sur les chemins xPath que je lui fourni pour récupérer les données souhaités.
Maintenant je travaille sur une page de ce format [code source en pastebin]: http://pastebin.com/M07UFUax
où j'ai montré les bloc que j'aimerai récupérer. chaque bloque doit être retourné comme un seul ensemble.
le chemin xPath du premier élément du bloc est: //div[@id="layer22"]/b/span[@style="background-color: #FFFF99"]
je l'ai bien testé et ça donne bien tous les élements "Début de bloc".
le chemin xPath du dernier élément du bloc est: //div[@id="layer22"]/a[contains(.,"Joindre")]
je l'ai bien testé et ça donne bien tous les élements "Fin de bloc".
Maintenant ce que je veux c'est récupérer tous les bloc en entier. Ce que j'ai du mal à réaliser.
Le chemin xPath devrait retourner un ensemble des blocs visé tel que:
(cheminXpathRecherché)[1] = tous les élements du bloc 1
(cheminXpathRecherché)[2] = tous les élements du bloc 2
....
En vous remerciant d'avance