Bonjour,
je dois parcourir un document html avec la fonction xpath de la librairie lxml de python. Le but est de récupérer tous les liens <a href="">, jusque là pas de problème.
Mon soucis est que la page est divisée en plusieurs pages et que le lien pour accéder à la suivante utilise une fonction javascript :
<a id="ctl01" href="javascript:__doPostBack('ctl01$listing$ctl00$pager$nextButton','')">Next</a>
et qu'il appelle la fonction suivante :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
|
<script type="text/javascript">
//<![CDATA[
var theForm = document.forms['form1'];
if (!theForm) {
theForm = document.form1;
}
function __doPostBack(eventTarget, eventArgument) {
if (!theForm.onsubmit || (theForm.onsubmit() != false)) {
theForm.__EVENTTARGET.value = eventTarget;
theForm.__EVENTARGUMENT.value = eventArgument;
theForm.submit();
}
}
//]]>
</script> |
Si vous avez une idée de comment utiliser cette fonction pour accéder aux différentes pages, je suis preneur !!
Merci !
Partager