Bonjour,
Je suis à la recherche d'un programme Java qui extrait les mots-clé d'un texte pour ensuite pouvoir effectuer une recherche indexée sur ce texte. Connaissez-vous une façon de faire ou une API spéciale ?
Merci,
Bonjour,
Je suis à la recherche d'un programme Java qui extrait les mots-clé d'un texte pour ensuite pouvoir effectuer une recherche indexée sur ce texte. Connaissez-vous une façon de faire ou une API spéciale ?
Merci,
Dans le cadre des mes études, j'ai suivi un module sur la recherche textuelle. Je ne l'ai pas utilisé moi-même mais beaucoup de mes camarades ont utilisé Lucene
Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
Ceylon : Installation - Concepts de base - Typage - Appels et arguments
ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
Une solution vous convient ? N'oubliez pas le tag
Signature par pitipoisson
Merci Nemek,
J'ai regardé rapidement ce que faisait Lucene et ça à l'air intéressant. Par contre, il indexe tous les mots d'un texte. Ce que j'aimerais, c'est un programme qui n'extrait que les mots signifiants. Mais je ne sais pas si ça existe...
Comme dit précédemment je connais pas Lucene mais le principe de la recherche textuelle nécessite de tout indexer. En revanche tu peux supprimer les éléments les moins significatifs (par exemple garder que les 100 premiers).
Le module que j'avais écrit possédait un paramètre qui faisait ça. Lucene doit le permettre également.
Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
Ceylon : Installation - Concepts de base - Typage - Appels et arguments
ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
Une solution vous convient ? N'oubliez pas le tag
Signature par pitipoisson
Et niveau performance, comment s'en sort Lucene ? Quelqu'un l'a déjà testé ?
Lucene est un gros projet Apache et l'un des meilleurs moteurs d'indexation du marché, utilisé par tous ces gens : http://wiki.apache.org/lucene-java/PoweredBy , vous pouvez y aller!
Partager