IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

API standards et tierces Java Discussion :

[Solr] [Lucene] TF-IDF avec Solr ou Lucene


Sujet :

API standards et tierces Java

  1. #1
    Débutant
    Inscrit en
    Juin 2007
    Messages
    453
    Détails du profil
    Informations forums :
    Inscription : Juin 2007
    Messages : 453
    Points : 97
    Points
    97
    Par défaut [Solr] [Lucene] TF-IDF avec Solr ou Lucene
    Bonjour,

    Je cherche un code pour implémenter l'algorithme tf-idf avec l'api Lucene ou Solr. J'ai implémenté le code par moi même mais il était lent surtout que je vais l'utiliser sur un grand nombre des fichiers.

    Je pense que ce deux api proposes des techniques efficaces pour éliminer les 'stopwords' ainsi que calcuer les valeurs tf-idf d'une manière efficace.

    J'ai cherché sur le net pour appliquer ce technique en utilisant ce deux api mais sans vain, je pense que c'est sûre qu'il y-a déjà des codes permettant de calculer ces valuers tf-idf.

    En effet, j'ai un ensemble des dossiers, chaque dossier contient un ensemble des fichiers textes et l'objectif est de déterminer les valeurs tf-idf de tous les mots qui existent dans ces fichiers texte.

    Toute information sera le bien venue et Merci d'avance.

  2. #2
    Membre actif
    Profil pro
    Développeur Back-End
    Inscrit en
    Août 2003
    Messages
    138
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur Back-End

    Informations forums :
    Inscription : Août 2003
    Messages : 138
    Points : 265
    Points
    265
    Par défaut
    solr le permet depuis la version 4.0 :
    https://lucene.apache.org/core/4_0_0...imilarity.html

    Axel

Discussions similaires

  1. Indexation de mots en Français avec SOLR
    Par canilunu dans le forum Autres
    Réponses: 1
    Dernier message: 26/06/2013, 11h52
  2. Intégrer Solr 4.2.1 avec Tomcat 6.0 à ma WebApp
    Par davinout dans le forum Tomcat et TomEE
    Réponses: 3
    Dernier message: 25/06/2013, 10h47
  3. Problème d'indexation avec Solr : write.lock timeout
    Par amalec78 dans le forum Autres
    Réponses: 1
    Dernier message: 21/09/2012, 14h10
  4. [1.x] Deployement en prod avec solr
    Par Monnier dans le forum Symfony
    Réponses: 6
    Dernier message: 16/04/2012, 05h41
  5. Indexation avec Solr
    Par sheira dans le forum Langage
    Réponses: 3
    Dernier message: 23/12/2010, 16h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo