Bonjour,
Avez-vous étudié cette page ? http://www.opensearchserver.com/docu...m_web_pages.md
Cela devrait vous permettre de cibler précisément les données à extraire.
Il faudra effectivement probablement retraiter la date avec un analyzer afin de la transformer en format AAAAMMJJ. Voici un exemple d'analyzer pouvant faire ce travail, il vous suffit de l'appliquer au champ qui reçoit la date extraite de la page.
Cet analyzer transforme une date au format JJ/MM/AAAA en format AAAAMMJJ. La regexp est :
([0-9]{2})/([0-9]{2})/([0-9]{4})
Merci,
Alexandre
Partager