Bonjour,
j'essaie actuellement de collecter tous les messages et les id de ces messages d'un forum: http://forum.doctissimo.fr/medicamen...ujet_953_1.htm
j'ai réussi à le faire avec des messages normaux(i.e qui sont pas une réponse d'un autre message) et je sais pas comment le faire pour les autres messages voila un exemple du message

Nom : help.png
Affichages : 145
Taille : 339,7 Ko

et voila mon code :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
from bs4 import BeautifulSoup
from a import *
import urllib.request
page=urllib.request.urlopen("http://forum.doctissimo.fr/medicaments/Neuroleptiques/souhaite-arreter-vousdes-sujet_953_1.htm")
strpage=page.read().decode(page.headers.get_content_charset())
soup=BeautifulSoup(strpage,'lxml')
 
 
u=soup.prettify()
v=soup.find_all('div','post_content')
 
for i in range(len(v)):
    x=unidecode(v[i].contents[0].contents[0])
    print(x)
voila le resultat de mon code :
Nom : l.png
Affichages : 209
Taille : 201,0 KoNom : l.png
Affichages : 209
Taille : 201,0 Ko
comme vous pouvez le voir ca affiche les messages "normaux" mais pas les autres.