|
Publicité | ||||||||||||||||||||||
|
|
#1 | ||||||
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Bonsoir chère communauté!
Tout d'abord, je me présente, parce que je suis nouveau parmis vous Je suis Sekler et je code en python depuis peu (1mois), j'ai l'ambition de faire un robot web qui irai chercher des informations sur le web. Pour le moment, je me débrouille par trop mal, et google m'a bien aidé. Mais là, je bloque Voici mon problème: Pour mon crawler, je souhaite utiliser un proxy, ici, pas de problème: Code :
Aussi, le site où j'essaye de me connecter requiert les cookies. Je faisais donc ceci (avant de prendre un proxy): Code :
Code :
J'ai essayé des tonnes de truc mais rien à faire Donc voilà, si vous avez de quoi m'aider, ça serait vraiment sympa. Merci beaucoup. |
||||||
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
Tu dois chaîner tes 2 handlers lors de l'appel à build_opener.
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
|
|
00
|
|
|
#3 |
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
Tu écris un robot dans quel but ?
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
|
|
00
|
|
|
#4 |
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Excuse moi, je ne vois pas ce que vous voulez dire par là, pouvez-vous me copier/coller un code d'exemple svp? J'écris ce bot dans le but de fournir des statistiques un site. Il ira se connecter sur le site et stockera des informations comme: Nombre de membres a chaque heure. Evolution des statistiques, etc. Mais à la base, c'est surtout pour "m'entrainer" à la création de bot, voir le fonctionnement, etc. |
|
|
00
|
|
|
#5 | |
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
Documentation Python :
Citation:
Code :
build_opener(proxy_support, cookie_processor)
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
|
|
|
00
|
|
|
#6 |
|
Membre chevronné
![]() Inscription : juillet 2006 Messages : 749 ![]() |
__________________
Linux ubuntu 8.04 Aspire 5611ZWLMi Intel Core Duo 1,6 GHz |
|
|
00
|
|
|
#7 |
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Merci pour votre aide.
J'ai une dernière question, y a-t-il un historique sous python? Je m'explique: Imaginons que je fasse: urlOpener.open('http://www.site1.com/page1.php') urlOpener.open('http://www.site1.com/page2.php') Est-ce que quand j'arriverai sur http://www.site1.com/page2.php, l'historique de ma page précédente sera: http://www.site1.com/page1.php ? Par exemple, pour un history.back en javascript. Merci. |
|
|
00
|
|
|
#8 | ||
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
A ma connaissance non, mais tu peut facilement en implémenter un dans une classe "Crawler" qui encapsulerait les appels à "urlOpener.open()" :
Code :
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
||
|
|
00
|
|
|
#9 |
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Merci pour ton code mchk0123, mais avec ce code, est-ce que page2.php
Saura que ma page d'avant était page1.php ? |
|
|
00
|
|
|
#10 |
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
Si j'ai bien compris tu veux que les scripts côté client (JavaScript ou autre) puissent s'exécuter comme dans un navigateur ?
Python n'a pas d'interpreteur JavaScript dans ses librairies par défaut, mais rien ne t'empêches d'en chercher une (en Py ou C/C++), de parser la page récupérée + liens externes, et d'assurer la liaison entre ton Crawler et l'interpreteur. Ce n'est pas une solution facile ni rapide. Bon courage.
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
|
|
00
|
|
|
#11 |
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Non, ce n'est pas ceci. Je vais mieux m'expliquer:
Je souhaite ouvrir une page qui est: http://www.site.com/attaque.php?id=123 Seulement, cette page vérifie d'ou l'on vient avec un: $_SERVER["HTTP_REFERER"] Si je ne viens pas de la page: http://www.site.com/joueur.php?id=123 Alors l'attaque sera annulée et je serai redirigé vers: http://www.site.com/joueur.php?id=123 Je souhaite donc ouvrir: http://www.site.com/joueur.php?id=123 puis: http://www.site.com/attaque.php?id=123 Mais le HTTP_REFERER ne semble pas voir de quelle page je provient. J'espère avoir bien expliqué :s merci |
|
|
00
|
|
|
#12 | ||
|
Membre chevronné
![]() Inscription : janvier 2007 Messages : 816 ![]() |
Ah ! Tu veux jouer avec le referer ? Il fallait le dire plus tôt.
Après l'installation des handlers : Code :
__________________
Avant de poster un message .Quand vous avez la réponse à votre question, n'oubliez pas de cliquer sur .
|
||
|
|
00
|
|
|
#14 |
|
Invité de passage
![]() Inscription : juillet 2008 Messages : 7 ![]() |
Merci beaucoup pour votre aide. C'est tres sympa!
MERCI |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com