Bonjour a tous,
je cherche a récupérer le contenu HTML d'une page web.
Comme d'habitude je sort urllib et fait
La pas de soucie, j'ai mon HTML...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 url = 'monUrl' page = urllib.urlopen(url) pageHtml = page.read() print pageHtml
Mais en regardant de plus prêt je vois qu'il manque du HTML dans la page !!!!!
Après une petite analyse de la page cible, je comprend que les morceau manquant sont générer en javascript ....
Il semble donc que urllib ne gère pas le Javascript.
Donc savez vous comment faire pour récupérer une page web qui a certaine partie de son contenue généré en Javascript ?
Je vous remercie par avance pour votre aide![]()
Partager