Hello,
Tout est dans le titre
Je voudrais trouver un parser simple pour collecter des données HTML.
J'ai vu qu'il y en a plusieurs mais c'est surtout des avis que je voudrais.
Merci![]()
Hello,
Tout est dans le titre
Je voudrais trouver un parser simple pour collecter des données HTML.
J'ai vu qu'il y en a plusieurs mais c'est surtout des avis que je voudrais.
Merci![]()
Oui je l'ai vu celui-là mais ce n'est pas un peu trop "sophistiqué" pour simplement récupérer des tableaux html ? Je voulais le faire en utilisant xpath.
Non, c'est plus simple que XPath.
Tadam!
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 soup = BeautifulSoup('http://www.foo.com') soup.findAll('table')
Connais tu un bon tutorial sur soup ?
Je trouve la doc succinte sur le site.
Merci![]()
J'ai toujours seulement utilisé la documentation sur leur site et la fonction help() dans l'interpréteur Python.
Encore une fois, on m'a demandé du code en privé. Le voici.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 import urllib from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(urllib.urlopen('http://www.developpez.com')) tds = soup.findAll('td', **{'class': 'tdt'}) for td in tds: title = ''.join(map(lambda x: x.string, td.a.contents)) print title
Partager