Bonjour,
Je suis à la recherche d'un programme Java qui extrait les mots-clé d'un texte pour ensuite pouvoir effectuer une recherche indexée sur ce texte. Connaissez-vous une façon de faire ou une API spéciale ?
Merci,
Version imprimable
Bonjour,
Je suis à la recherche d'un programme Java qui extrait les mots-clé d'un texte pour ensuite pouvoir effectuer une recherche indexée sur ce texte. Connaissez-vous une façon de faire ou une API spéciale ?
Merci,
Dans le cadre des mes études, j'ai suivi un module sur la recherche textuelle. Je ne l'ai pas utilisé moi-même mais beaucoup de mes camarades ont utilisé Lucene
Merci Nemek,
J'ai regardé rapidement ce que faisait Lucene et ça à l'air intéressant. Par contre, il indexe tous les mots d'un texte. Ce que j'aimerais, c'est un programme qui n'extrait que les mots signifiants. Mais je ne sais pas si ça existe...
Comme dit précédemment je connais pas Lucene mais le principe de la recherche textuelle nécessite de tout indexer. En revanche tu peux supprimer les éléments les moins significatifs (par exemple garder que les 100 premiers).
Le module que j'avais écrit possédait un paramètre qui faisait ça. Lucene doit le permettre également.
Et niveau performance, comment s'en sort Lucene ? Quelqu'un l'a déjà testé ?
Lucene est un gros projet Apache et l'un des meilleurs moteurs d'indexation du marché, utilisé par tous ces gens : http://wiki.apache.org/lucene-java/PoweredBy , vous pouvez y aller!