Bonjour,

je dois parcourir un document html avec la fonction xpath de la librairie lxml de python. Le but est de récupérer tous les liens <a href="">, jusque là pas de problème.

Mon soucis est que la page est divisée en plusieurs pages et que le lien pour accéder à la suivante utilise une fonction javascript :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
<a id="ctl01" href="javascript:__doPostBack('ctl01$listing$ctl00$pager$nextButton','')">Next</a>
et qu'il appelle la fonction suivante :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
 
<script type="text/javascript">
//<![CDATA[
var theForm = document.forms['form1'];
if (!theForm) {
    theForm = document.form1;
}
function __doPostBack(eventTarget, eventArgument) {
    if (!theForm.onsubmit || (theForm.onsubmit() != false)) {
        theForm.__EVENTTARGET.value = eventTarget;
        theForm.__EVENTARGUMENT.value = eventArgument;
        theForm.submit();
   }
}
//]]>
</script>
Si vous avez une idée de comment utiliser cette fonction pour accéder aux différentes pages, je suis preneur !!

Merci !