1. #1
    Futur Membre du Club
    Homme Profil pro
    Inscrit en
    janvier 2013
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : janvier 2013
    Messages : 10
    Points : 6
    Points
    6

    Par défaut Opinion mining, classement des commentaires grâce aux étoiles

    Bonjour à tous, je vous sollicite car j'effectue de l'opinion mining cela consiste à travers des commentaires recueillit,établir si ces commentaires sont positifs ou négatifs.
    Pour la première étape, je veux créer un programme qui puisse prendre des commentaires sur des sites comme "TripAdvisor" et ,ces sites ont la particularités de classer les commentaires grâce à des étoiles,de ce fait,je saurais qu'un commentaire avec 5 ou 4 étoiles est forcement positif.
    Je veux classer les commentaires en fonctions de leur nombre d'étoiles.
    J'ai réussi à sélectionner quelques commentaires (Scraping) grace à la bibliothèque Beautiful soup de python.
    En stipulant que je voulais récupérer les paragraphes
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    import bs4 as bs
    import urllib.request
    url = urllib.request.urlopen('https://www.tripadvisor.fr/Hotel_Review-g187497-d7142609-Reviews-or5-Hotel_The_Serras-Barcelona_Catalonia.html#REVIEWS').read()
    soup = bs.BeautifulSoup(url, 'lxml')
    #print (soup)
    com = soup.find_all('p')
    for i in com:
        print(i.text)
    La où ça bloque,c'est au niveau de la classification des commentaires,je sais pas comment procéder.
    Je vais avoir besoin de votre aide s'il vous plait

  2. #2
    Membre averti
    Homme Profil pro
    ValueError
    Inscrit en
    avril 2016
    Messages
    267
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : ValueError

    Informations forums :
    Inscription : avril 2016
    Messages : 267
    Points : 382
    Points
    382

    Par défaut

    Salut,

    As-tu regardé le code source de la page ?

    Désactive javascript, et recharge la page, déjà tu pourras constater que c'est plus difficile que cela en a l'air, maintenant en regardant la class css de ce span, on a ui_bubble_rating bubble_50, reste à voir si bubble_50 correspond à 5 étoiles, et pour ça faut farfouiller dans les feuilles de styles de la page pour voir si y'a des bubble_40, bubble_30, etc. Ou dans le js si les class css sont crées via ce biais.

    Un outil indispensable pour Firefox est web developper lorsqu'on veut analyser html et css d'une page, je te le recommande fortement.

    HS :
    Par contre les commentaires de ce genre de site valent rien, on voit bien que c'est soit fait par des bots, soit par des gens en étroites relations avec l'hôtel concerné.

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Inscrit en
    janvier 2013
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : janvier 2013
    Messages : 10
    Points : 6
    Points
    6

    Par défaut

    Merci pour ta réponse,les commentaires je les utilises dans un but pédagogique.
    j'ai fais ce que tu as dit, dans le code source "ui_bubble_rating bubble_50" correspond bien aux notes avec 5 ronds donc des commentaires positifs.
    Avec un "CTRL F",on trouve des informations intéressantes.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <span class="ui_bubble_rating bubble_50"></span><span class="ratingDate relativeDate" title='4 mai 2017'>Avis publié: Il y a 1 semaine </span> </div><DIV class="prw_rup prw_common_html" data-prwidget-name="common_html" data-prwidget-init=""><div class="entry"><p class="partial_entry">En sus de l&#39;emplacement idéal à deux minutes à pied de la rue piétonne et passante d&#39;Aix et ses restaurants à souhait, le Renaissance se démarque par le professionnel hors pair du personnel: le voiturier , la réception, les employés polyvalents de la restauration touts aussi aimable, souriant, et accueillant mais aussi toutes les univers à découvrir au sein cet...</p></div></DIV>
    Le défi maintenant c'est de trouver le moyen de classer les commentaires grâce à la classe "ui_bubble_rating bubble_50",j'ai vu que les commentaires était dans la balise <p class="partial_entry">.
    C'est un bon début déjà.
    Tu as une solution ?

  4. #4
    Membre averti
    Homme Profil pro
    ValueError
    Inscrit en
    avril 2016
    Messages
    267
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : ValueError

    Informations forums :
    Inscription : avril 2016
    Messages : 267
    Points : 382
    Points
    382

    Par défaut

    Citation Envoyé par urameshi Voir le message
    Le défi maintenant c'est de trouver le moyen de classer les commentaires grâce à la classe "ui_bubble_rating bubble_50",j'ai vu que les commentaires était dans la balise <p class="partial_entry">.
    C'est un bon début déjà.
    Tu as une solution ?
    Le plus gros défi n'est pas d'arriver à les classer, ça c'est facile, il est plutôt d'arriver à récupérer correctement les éléments que tu souhaites obtenir.
    Et encore un autre plus gros défi sera de parcourir toutes les pages de commentaires, pour en récupérer ces infos.

    Et oui, le commentaire est bien dans ce paragraphe, mais l'élément qui t'intéresse est plus haut.

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Inscrit en
    janvier 2013
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : janvier 2013
    Messages : 10
    Points : 6
    Points
    6

    Par défaut

    Je vais essayer je vous tient au courant si il y" a du nouveau.

Discussions similaires

  1. Réponses: 4
    Dernier message: 21/05/2011, 01h14
  2. Ajouter des commentaire aux fonction/sub d'une dll
    Par zebrette dans le forum VB.NET
    Réponses: 2
    Dernier message: 11/04/2011, 10h13
  3. [Article] Des menus déroulants grâce aux CSS
    Par Bovino dans le forum Publications (X)HTML et CSS
    Réponses: 1
    Dernier message: 05/05/2009, 00h44
  4. Positions des sous-chaînes grâce aux regex
    Par oneTime dans le forum Regex
    Réponses: 1
    Dernier message: 12/09/2008, 13h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo