IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Documents Java Discussion :

Extraction des mots-clé d'un fichier texte


Sujet :

Documents Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2011
    Messages : 20
    Par défaut Extraction des mots-clé d'un fichier texte
    Bonjour,

    Je suis à la recherche d'un programme Java qui extrait les mots-clé d'un texte pour ensuite pouvoir effectuer une recherche indexée sur ce texte. Connaissez-vous une façon de faire ou une API spéciale ?

    Merci,

  2. #2
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Par défaut
    Dans le cadre des mes études, j'ai suivi un module sur la recherche textuelle. Je ne l'ai pas utilisé moi-même mais beaucoup de mes camarades ont utilisé Lucene
    Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
    Ceylon : Installation - Concepts de base - Typage - Appels et arguments

    ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
    Une solution vous convient ? N'oubliez pas le tag
    Signature par pitipoisson

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2011
    Messages : 20
    Par défaut
    Merci Nemek,

    J'ai regardé rapidement ce que faisait Lucene et ça à l'air intéressant. Par contre, il indexe tous les mots d'un texte. Ce que j'aimerais, c'est un programme qui n'extrait que les mots signifiants. Mais je ne sais pas si ça existe...

  4. #4
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Par défaut
    Comme dit précédemment je connais pas Lucene mais le principe de la recherche textuelle nécessite de tout indexer. En revanche tu peux supprimer les éléments les moins significatifs (par exemple garder que les 100 premiers).

    Le module que j'avais écrit possédait un paramètre qui faisait ça. Lucene doit le permettre également.
    Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
    Ceylon : Installation - Concepts de base - Typage - Appels et arguments

    ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
    Une solution vous convient ? N'oubliez pas le tag
    Signature par pitipoisson

  5. #5
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2011
    Messages : 20
    Par défaut
    Et niveau performance, comment s'en sort Lucene ? Quelqu'un l'a déjà testé ?

  6. #6
    Nouveau candidat au Club
    Profil pro
    Inscrit en
    Décembre 2008
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2008
    Messages : 2
    Par défaut
    Lucene est un gros projet Apache et l'un des meilleurs moteurs d'indexation du marché, utilisé par tous ces gens : http://wiki.apache.org/lucene-java/PoweredBy , vous pouvez y aller!

Discussions similaires

  1. extraction des mots d'un texte
    Par Scarlet Ibis dans le forum Débuter
    Réponses: 5
    Dernier message: 16/05/2012, 09h40
  2. [TPW] Extraction des mots d'un texte
    Par adrian07 dans le forum Turbo Pascal
    Réponses: 4
    Dernier message: 12/01/2009, 13h58
  3. extraction de données à partir d'un fichier text ou xml
    Par bigplayer dans le forum Langage
    Réponses: 3
    Dernier message: 28/03/2007, 17h13
  4. Réponses: 3
    Dernier message: 04/01/2007, 17h42
  5. Transposer des données sql dans un fichier texte
    Par Anakior dans le forum Outils
    Réponses: 3
    Dernier message: 11/12/2005, 10h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo