problème google image

Version imprimable

15/05/2014, 15h48
napoleon59

problème google image

Bonjour,

Je débute en python. J'aimerai récupérer l'url d'une image de google image. J'ai vu que dans le code source il y a un repère.

La requête que j'exécute dans mon script serait https://www.google.com/search?source...panda&tbm=isch

Le SRC de l'image se trouve entre la balise imgurl= et &.

Avez-vous une idée assez pour pouvoir récupérer l'url via un script ?

Merci.
15/05/2014, 17h36
VinsS

Salut,

Ce que tu demandes est très simple, sauf qu'il y a largement plus de deux cents images sur cette page, alors ...
16/05/2014, 09h31
napoleon59

Ca tombe bien car je veux récupérer une seule image de manière aléatoire donc j'utiliserai la fonction random() sur une plage de 0 à 50.
16/05/2014, 09h31
napoleon59

Mais je ne sais pas par où démarrer étant donné que c'est mon premier script.
16/05/2014, 17h45
dev_ggy

Bonjour,

Ces deux lien ne répondent pas à ta demande ?

Pour récupérer l'image :

developpez.com

Avec Cela pour parcourir la DOM:

Package pour le HTML

Cordialement.
17/05/2014, 19h20
napoleon59

Merci pour la réponse j'ai trouvé un bout de code que j'ai adapté un peu mais j'ai quelques questions.

A chaque fois que je lance le script, il me sort 5 résultats alors que je n'en souhaite qu'un seul. Savez-vous comment faire ?

Enfin pensez-vous qu'il est possible de simplifier le code ?

import os
import sys
import time
from urllib import FancyURLopener
import urllib2
import json as simplejson

# Define search term

searchTerm = voiture

# Replace spaces ' ' in search term for '%20' in order to comply with request
searchTerm = searchTerm.replace(' ','%20')

# Start FancyURLopener with defined version
class MyOpener(FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()

# Set count to 0
count= 0

for i in range(0,1):
# Notice that the start changes for each iteration in order to request a new set of images for each loop
url = ('https://ajax.googleapis.com/ajax/services/search/images?' + 'v=1.0&q='+searchTerm+'&start='+str(i*4)+'&userip=MyIP')
print url
request = urllib2.Request(url, None, {'Referer': 'testing'})
response = urllib2.urlopen(request)

# Get results using JSON
results = simplejson.load(response)
data = results['responseData']
dataInfo = data['results']

# Iterate for each result and get unescaped url
for myUrl in dataInfo:
count = count + 1
print myUrl['unescapedUrl']

myopener.retrieve(myUrl['unescapedUrl'],str(count)+'.jpg')

# Sleep for one second to prevent IP blocking from Google
time.sleep(1)