bonsoir, j'essaye d'extraire des données d'un site internet (en l'occurrence 'https://www.google.fr/) mais j'obtiens une liste vide, j'ai essayé de deux façons différentes :
1ere façon:
output :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 site = html.fromstring('https://www.google.fr/') response = requests.get('https://www.google.fr/') tree = html.fromstring(response.text) title_elem = tree.xpath('/html/head/title/text()') test = tree.xpath('//*[@id="fbar"]/div/div/div/span/text()') # = xpath de 'France' en bas a gauche de la page, return vide liste print title_elem print test
['Google']
[]
2nd façon :
output :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 parser = etree.HTMLParser() html = etree.parse('http://www.google.fr/',parser) result = html.xpath('/html/head/title/text()') test = html.xpath('//*[@id="fbar"]/div/div/div/span/text()') # pareil, xpath de 'France' en bas a gauche de la page, et me return une liste vide print(result) print test
['Google']
[]
j'arrive donc a recuperer le titre, mais pas 'France', une solution ? merci !
Partager