IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web sémantique Discussion :

Module de classement des documents OpenCalais


Sujet :

Web sémantique

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Mai 2012
    Messages
    175
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2012
    Messages : 175
    Par défaut Module de classement des documents OpenCalais
    Bonjour à tous,

    Je cherche un outil pour classifier des documents selon leur thèmes (Toppic modeling). OpenCalais offre un service qui a première vue paraît intéressent (Document Categorization) pour ce service mais j'ai pas réussi ni à l'utiliser ni a trouvé aucune documentation.

    Avez-vous une idée s'il vous plaît ?

  2. #2
    Membre émérite
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Par défaut
    Les web services Open Calais sont pourtant bien documentés. Il y a par exemple un exemple d'appel au service en Java, et une documentation sur la structure des données retournées par l'API, en JSON par exemple.
    Pour tout cela il faut que tu demandes une clé d'API.
    Il est possible que la fonction "Document Categorization" de l'API ne fonctionne que pour du contenu anglais.

  3. #3
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Mai 2012
    Messages
    175
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2012
    Messages : 175
    Par défaut
    Merci beaucoup pour votre réponse.

    OpenCalais répose sur le taxonomie 'IPTC News code' pour faire la classification mais malheureusement juste les Top niveau des thèmes si je me trompe pas. En effet il fait la classification juste entre les niveaux supérieur du taxonomie et pas une classification même pour les sous thèmes (sub-topics)... Alors il paraît non intéressent comme outil, que pensez-vous ?

    En plus, j'ai eu ce résultat pour un texte en entrée mais j'ai pas compris le type des résultats que j'ai eu du Opencalais et comment je peux les gérer, C'st du JSON ou quoi :


    <!--Use of the Calais Web Service is governed by the Terms of Service located at http://www.opencalais.com. By using this service or the results of the service you agree to these terms of service.--><!--
    Continent: America,
    Country: United States,
    Currency: USD,
    IndustryTerm: healthcare,
    Organization: Congress,Heritage Foundation,
    Person: Kay Bailey Hutchinson,Robert Rector,
    SportsEvent: the Heritage,
    --><OpenCalaisSimple><Description><allowDistribution>true</allowDistribution><allowSearch>true</allowSearch><calaisRequestID>addbdcd4-9520-a6de-1425-603f5e04269b</calaisRequestID><externalID>17cabs901</externalID><id>http://id.opencalais.com/5qqzrp4q*jIIlLqONyCMeQ</id><about>http://d.opencalais.com/dochash-1/d1256f5d-096d-3ea5-a2ab-4a8cd620748b</about><docTitle/><docDate>2013-11-14 04:49:31.391</docDate><externalMetadata/><submitter>ABC</submitter></Description><CalaisSimpleOutputFormat><Country count="8" relevance="0.653" normalized="United States">United States</Country><Organization count="6" relevance="0.754">Congress</Organization><Continent count="2" relevance="0.393">America</Continent><Currency count="2" relevance="0.449">USD</Currency><IndustryTerm count="2" relevance="0.399">healthcare</IndustryTerm><Organization count="2" relevance="0.450">Heritage Foundation</Organization><Person count="2" relevance="0.432">Kay Bailey Hutchinson</Person><Person count="2" relevance="0.450">Robert Rector</Person><SportsEvent count="2" relevance="0.450">the Heritage</SportsEvent><Topics><Topic Taxonomy="Calais" Score="0.992">Social Issues</Topic></Topics></CalaisSimpleOutputFormat></OpenCalaisSimple>


  4. #4
    Membre émérite
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Par défaut
    Citation Envoyé par daniel1985 Voir le message
    OpenCalais répose sur le taxonomie 'IPTC News code' pour faire la classification mais malheureusement juste les Top niveau des thèmes si je me trompe pas. En effet il fait la classification juste entre les niveaux supérieur du taxonomie et pas une classification même pour les sous thèmes (sub-topics)... Alors il paraît non intéressent comme outil, que pensez-vous ?
    Oui, c'est ça les "top-level subject codes only". Je ne connais pas ton besoin, je ne sais pas si c'est intéressant pour toi, il n'y a que toi qui peux le dire.

    Citation Envoyé par daniel1985 Voir le message
    En plus, j'ai eu ce résultat pour un texte en entrée mais j'ai pas compris le type des résultats que j'ai eu du Opencalais et comment je peux les gérer, C'st du JSON ou quoi :
    Non, là c'est le format XML qu'ils appellent "Simple Format", documenté ici. Les topics sont à la fin :

    ...<Topics><Topic Taxonomy="Calais" Score="0.992">Social Issues</Topic></Topics>

    Il faut que tu parses cette structure de données XML pour extraire l'info qui t'intéresse.

  5. #5
    Membre du Club
    Femme Profil pro
    Chercheur en informatique
    Inscrit en
    Novembre 2013
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Novembre 2013
    Messages : 7
    Par défaut
    bonjour, je veux faire la même chose
    et je veux savoir si la nouvelle version d'opencalais ne supporte encore pas les sous catégories de la taxonomie newsml.
    sinon qu'est ce que vous proposez comme solution?
    Merci beaucoup

  6. #6
    Membre émérite
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Par défaut
    Tu peux regarder du côté d'Alchemy API.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Récupérer des documents réseaux (intranet) !!
    Par hutchuck dans le forum Langage
    Réponses: 7
    Dernier message: 15/12/2005, 17h35
  2. Réponses: 9
    Dernier message: 14/12/2005, 18h44
  3. Classement des langages
    Par trattos dans le forum Langages de programmation
    Réponses: 9
    Dernier message: 07/12/2005, 12h09
  4. recherche de module pour faire des graphiques
    Par Ickou dans le forum Modules
    Réponses: 1
    Dernier message: 01/11/2005, 22h20
  5. Réponses: 11
    Dernier message: 26/04/2005, 09h23

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo