Bonjour,
j'essaie actuellement de collecter tous les messages et les id de ces messages d'un forum: http://forum.doctissimo.fr/medicamen...ujet_953_1.htm
j'ai réussi à le faire avec des messages normaux(i.e qui sont pas une réponse d'un autre message) et je sais pas comment le faire pour les autres messages voila un exemple du message
et voila mon code :
voila le resultat de mon code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 from bs4 import BeautifulSoup from a import * import urllib.request page=urllib.request.urlopen("http://forum.doctissimo.fr/medicaments/Neuroleptiques/souhaite-arreter-vousdes-sujet_953_1.htm") strpage=page.read().decode(page.headers.get_content_charset()) soup=BeautifulSoup(strpage,'lxml') u=soup.prettify() v=soup.find_all('div','post_content') for i in range(len(v)): x=unidecode(v[i].contents[0].contents[0]) print(x)
comme vous pouvez le voir ca affiche les messages "normaux" mais pas les autres.
Partager