Bonsoir!

Alors, j'ai besoin d'un peu d'aide pour récupérer des informations sur des pages web qui sont 'mal' écrite. En effet, j'utilise beautifulsoup, mais ce dernier ne fonctionne pas dans le cas de certaines pages web.

Une par exemple: http://www.allocine.fr/film/fichefil...ilm=45890.html

Mon code est celui que l'on trouve dans pas mal d'exemples sur le web:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
url = 'http://www.allocine.fr/film/fichefilm_gen_cfilm=45890.html'
page=urllib2.urlopen(url)
html=page.read()
indexSoup=BeautifulSoup(html)
Voila, j'ai une erreur. Alors ,ma question est comment faire pour que cette page passe dans beautifulsoup?

Merci d'avance =)