IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web sémantique Discussion :

Recherche d'outil d'analyse


Sujet :

Web sémantique

  1. #1
    Candidat au Club
    Homme Profil pro
    Assistant chef de projet technique
    Inscrit en
    Avril 2012
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Assistant chef de projet technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 6
    Points : 2
    Points
    2
    Par défaut Recherche d'outil d'analyse
    Bonjour à tous,
    C'est mon premier post, j’espère l'avoir fait dans la bonne catégorie. Comme le titre l'indique, je recherche un outil qui permet de scanner le contenu d'une page, et d'en extraire les mots clés les plus pertinent en se basant sur la récurrence notamment. J'attends donc de savoir quelles outils vous utilisez qu'ils soient plus ou moins "complet".

    En vous remerciant d'avance de votre participation!!!!!!!
    Bouuhhh

  2. #2
    Rédacteur/Modérateur
    Avatar de Metafire18
    Homme Profil pro
    Ingénieur de recherche Orange Labs
    Inscrit en
    Décembre 2007
    Messages
    777
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Territoire de Belfort (Franche Comté)

    Informations professionnelles :
    Activité : Ingénieur de recherche Orange Labs

    Informations forums :
    Inscription : Décembre 2007
    Messages : 777
    Points : 1 894
    Points
    1 894
    Billets dans le blog
    1
    Par défaut
    C'est raté pour le choix du forum

    Je te conseille toutefois de regarder du côté de TF/IDF (Term Frequency/Inverse Document Frequency).
    Pas de grandeur pour qui veut grandir. Pas de modèle pour qui cherche ce qu'il n'a jamais vu.

  3. #3
    Candidat au Club
    Homme Profil pro
    Assistant chef de projet technique
    Inscrit en
    Avril 2012
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Assistant chef de projet technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 6
    Points : 2
    Points
    2
    Par défaut
    Merci pour la rapidité de la réponse, et tu as tapé exactement dans le mille!!
    La méthode représente exactement ce dont j'ai besoin, mais connaitrais-tu un outil qui l'utilise ?

  4. #4
    Rédacteur/Modérateur
    Avatar de Metafire18
    Homme Profil pro
    Ingénieur de recherche Orange Labs
    Inscrit en
    Décembre 2007
    Messages
    777
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Territoire de Belfort (Franche Comté)

    Informations professionnelles :
    Activité : Ingénieur de recherche Orange Labs

    Informations forums :
    Inscription : Décembre 2007
    Messages : 777
    Points : 1 894
    Points
    1 894
    Billets dans le blog
    1
    Par défaut
    Je ne sais pas. Je ne serais pas surpris que que l'outil suivant ait recours à cette technique: http://gate.ac.uk/
    Pas de grandeur pour qui veut grandir. Pas de modèle pour qui cherche ce qu'il n'a jamais vu.

  5. #5
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    Je ne crois pas que Gate utilise TF/IDF : il fonctionne plutôt à l'aide de grammaires linguistiques. Ce sont les outils de search comme SolR qui utilisent ce genre d'algo.

    Dans l'écosystème du web sémantique on peut trouver DBPedia Spotlight (http://dbpedia.org/spotlight) qui permet de détecter des entités de DBPEdia dans un texte; ca ne s'appuie pas sur du TF/IDF, c'est simplement de la détection d'entités. OpenCalais (http://www.opencalais.com/) fournit quelque chose de similaire. Après, une fois les entités détectées, il suffiraient de compter combien de fois elles sont apparues dans le contenu.

  6. #6
    Candidat au Club
    Homme Profil pro
    Assistant chef de projet technique
    Inscrit en
    Avril 2012
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Assistant chef de projet technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 6
    Points : 2
    Points
    2
    Par défaut
    J'essaie de voir comment fonctionne Gate. Ce qui me plaisait dans le TF/IDF c'est qu'il permettait de pondérer la pertinence des mots par rapport à la présence dans des articles du corpus. En fait pour être clair, je cherche à comparer les mots clés de plusieurs articles entre eux. Donc dans ce sens TF/IDF était assez complet. Trouver comment l'utiliser serait top!
    Je ne sais pas si mon explication est trop confuse, dites le moi au cas.

  7. #7
    Rédacteur/Modérateur
    Avatar de Metafire18
    Homme Profil pro
    Ingénieur de recherche Orange Labs
    Inscrit en
    Décembre 2007
    Messages
    777
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Territoire de Belfort (Franche Comté)

    Informations professionnelles :
    Activité : Ingénieur de recherche Orange Labs

    Informations forums :
    Inscription : Décembre 2007
    Messages : 777
    Points : 1 894
    Points
    1 894
    Billets dans le blog
    1
    Par défaut
    TF/IDF est utile lorsque tu veux comparer la pertinence des termes d'un document donné. Je ne pense pas que, dans sa version de base, cette technique soit adaptée pour comparer la pertinence de mots-clefs entre documents car ces derniers peuvent être de tailles variables notamment (tu peux regarder du côté de cette variante de TF/IDF pour obtenir de meilleurs résultats). Dans TF/IDF, le corpus est seulement utile pour calculer les indices d'IDF.

    Si tu as un peu de temps devant toi, TF/IDF est assez rapide à implémenter. Il m'a fallu quelques heures pour coder un outil en Java utilisant cette méthode.
    Pas de grandeur pour qui veut grandir. Pas de modèle pour qui cherche ce qu'il n'a jamais vu.

Discussions similaires

  1. Recherche d'outil de modelisation
    Par Matthieu Brucher dans le forum Outils
    Réponses: 33
    Dernier message: 14/11/2014, 11h37
  2. [Recherche]Outil d'analyse de temps de code
    Par Spout dans le forum C++
    Réponses: 12
    Dernier message: 26/08/2008, 14h13
  3. Outil d'analyse de code
    Par Bloon dans le forum Outils
    Réponses: 8
    Dernier message: 07/08/2007, 09h04
  4. Recherche outil d'analyse et rapport pour C++
    Par tnarol dans le forum C++
    Réponses: 3
    Dernier message: 06/09/2006, 13h14
  5. Outils d'analyse statique de code assembleur ?
    Par atomic dans le forum Assembleur
    Réponses: 4
    Dernier message: 11/06/2004, 11h42

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo