Bonsoir!
Alors, j'ai besoin d'un peu d'aide pour récupérer des informations sur des pages web qui sont 'mal' écrite. En effet, j'utilise beautifulsoup, mais ce dernier ne fonctionne pas dans le cas de certaines pages web.
Une par exemple: http://www.allocine.fr/film/fichefil...ilm=45890.html
Mon code est celui que l'on trouve dans pas mal d'exemples sur le web:
Voila, j'ai une erreur. Alors ,ma question est comment faire pour que cette page passe dans beautifulsoup?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 url = 'http://www.allocine.fr/film/fichefilm_gen_cfilm=45890.html' page=urllib2.urlopen(url) html=page.read() indexSoup=BeautifulSoup(html)
Merci d'avance =)
Partager