Bonjour à tous, je vous sollicite car j'effectue de l'opinion mining cela consiste à travers des commentaires recueillit,établir si ces commentaires sont positifs ou négatifs.
Pour la première étape, je veux créer un programme qui puisse prendre des commentaires sur des sites comme "TripAdvisor" et ,ces sites ont la particularités de classer les commentaires grâce à des étoiles,de ce fait,je saurais qu'un commentaire avec 5 ou 4 étoiles est forcement positif.
Je veux classer les commentaires en fonctions de leur nombre d'étoiles.
J'ai réussi à sélectionner quelques commentaires (Scraping) grace à la bibliothèque Beautiful soup de python.
En stipulant que je voulais récupérer les paragraphes
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
import bs4 as bs
import urllib.request
url = urllib.request.urlopen('https://www.tripadvisor.fr/Hotel_Review-g187497-d7142609-Reviews-or5-Hotel_The_Serras-Barcelona_Catalonia.html#REVIEWS').read()
soup = bs.BeautifulSoup(url, 'lxml')
#print (soup)
com = soup.find_all('p')
for i in com:
    print(i.text)
La où ça bloque,c'est au niveau de la classification des commentaires,je sais pas comment procéder.
Je vais avoir besoin de votre aide s'il vous plait