Bonjour à tous, je vous sollicite car j'effectue de l'opinion mining cela consiste à travers des commentaires recueillit,établir si ces commentaires sont positifs ou négatifs.
Pour la première étape, je veux créer un programme qui puisse prendre des commentaires sur des sites comme "TripAdvisor" et ,ces sites ont la particularités de classer les commentaires grâce à des étoiles,de ce fait,je saurais qu'un commentaire avec 5 ou 4 étoiles est forcement positif.
Je veux classer les commentaires en fonctions de leur nombre d'étoiles.
J'ai réussi à sélectionner quelques commentaires (Scraping) grace à la bibliothèque Beautiful soup de python.
En stipulant que je voulais récupérer les paragraphes
La où ça bloque,c'est au niveau de la classification des commentaires,je sais pas comment procéder.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 import bs4 as bs import urllib.request url = urllib.request.urlopen('https://www.tripadvisor.fr/Hotel_Review-g187497-d7142609-Reviews-or5-Hotel_The_Serras-Barcelona_Catalonia.html#REVIEWS').read() soup = bs.BeautifulSoup(url, 'lxml') #print (soup) com = soup.find_all('p') for i in com: print(i.text)
Je vais avoir besoin de votre aide s'il vous plait
Partager