Précédent   Forum du club des développeurs et IT Pro > Autres langages > Python & Zope > Réseau/Web
Réseau/Web Forum d'entraide sur Python et le réseau/Web
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 18/12/2012, 11h19   #1
nireas
Invité de passage
 
Inscription : novembre 2012
Messages : 9
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 9
Points : 1
Points : 1
Par défaut Récupération d'une page chargée en Javascript/AJAX

Bonjour,

J'utilise mechanize pour simuler un navigateur web et BeautifulSoup pour parser l'HTML. Hors j'ai un petit soucis avec certaines pages. Certaines pages se chargent via du javascript/ajax, du coup lorsque je .read() la page, je récupère la page qui est en train de se charger (avec les images load.gif etc..).

Comment puis-je faire pour récupérer l'HTML une fois le chargement dynamique terminé?
J'ai essayé un petit time.sleep(15) (on ne sait jamais) rien ne fait

Avez-vous une idée?
Merci d'avance
nireas est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/12/2012, 15h54   #2
nireas
Invité de passage
 
Inscription : novembre 2012
Messages : 9
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 9
Points : 1
Points : 1
Mechanize ne prendrait pas en compte le JS et l'AJAX

J'ai trouvé quelques post proposant d'utiliser Selenium par exemple
Mais il ouvre le navigateur dans une fenêtre directement. Par la suite j'ai trouvé un moyen de cacher cette fenêtre, car je souhaite rester en mode console. Mais c'est juste ULTRA lent j'ai l'impression de faire du Java

Quelqu'un a t-il une solution ?
Merci
nireas est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/12/2012, 16h01   #3
wiztricks
Expert Confirmé Sénior
 
Inscription : juin 2008
Messages : 3 689
Détails du profil
Informations forums :
Inscription : juin 2008
Messages : 3 689
Points : 4 517
Points : 4 517
Salut,
Si vous voulez récupérer le contenu de la page sans charger les contenus, pourquoi travailler en mode "Browser"?
- W
__________________
Architectures Post-Modernes
wiztricks est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/12/2012, 16h03   #4
nireas
Invité de passage
 
Inscription : novembre 2012
Messages : 9
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 9
Points : 1
Points : 1
Car je dois accepter JS, Cookie etc...
nireas est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/12/2012, 16h53   #5
VinsS
Membre Expert
 
Homme
Inscription : octobre 2008
Messages : 935
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Belgique

Informations forums :
Inscription : octobre 2008
Messages : 935
Points : 1 401
Points : 1 401
Éventuellement, regardes du coté de QWebkit qui permet d'interagir avec le contenu d'une page chargée normalement.

Je m'en sert pour afficher des maps d'OpenStreetMap en gérant tout en Python.

http://www.riverbankcomputing.co.uk/.../qtwebkit.html


Il y a aussi le module QWebInspector qui mérite d'être testé.
Ce module s'ouvre dans une fenêtre et permet d'observer tout ce qui se passe au niveau de la page chargée.

http://www.riverbankcomputing.co.uk/...inspector.html
__________________
Vincent
Oqapy . Qarte . PaQager
VinsS est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 14h01.


 
 
 
 
Partenaires

Hébergement Web