IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Autres Java Discussion :

Indexation de mots en Français avec SOLR


Sujet :

Autres Java

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Développeur Java
    Inscrit en
    Mars 2013
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2013
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Indexation de mots en Français avec SOLR
    Bonjour,
    j'ai un petit soucis de configuration de SOLR pour l'indexation de mots en français.
    En fait je dois indéxer des documents contenant les mots cathéter ou cathéters.
    Mon schema est configuré comme cela (la partie index est sensiblement la même que la partie query).
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.ElisionFilterFactory" articles="elisionwords_fr.txt"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords_fr.txt" enablePositionIncrements="true"/>
        <filter class="solr.SnowballPorterFilterFactory" language="French"/>
        <filter class="solr.ASCIIFoldingFilterFactory"/>
    </analyzer>
    Cette configuration fait que le mot cathéter est indexé, sans doute comme un verbe et la lemmatisation donne cathet alors qu'avec cathéters cela donne catheter.
    Du coup les documents contenant cathéter ne remontent pas quand je cherche cathéters.

    Si vous avez une piste ... je suis preneur.
    Merci d'avance.

  2. #2
    Candidat au Club
    Profil pro
    Inscrit en
    Juin 2013
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2013
    Messages : 3
    Points : 4
    Points
    4
    Par défaut
    je suis novice mais la question m'intéresse, du coup est ce qu'il ne faut pas modifier la partie indexation?
    comment est fait l'élément <analyser type="index"/> ?

Discussions similaires

  1. Réponses: 2
    Dernier message: 20/02/2017, 19h53
  2. Problème d'indexation avec Solr : write.lock timeout
    Par amalec78 dans le forum Autres
    Réponses: 1
    Dernier message: 21/09/2012, 15h10
  3. Indexation avec Solr
    Par sheira dans le forum Langage
    Réponses: 3
    Dernier message: 23/12/2010, 17h43
  4. Réponses: 2
    Dernier message: 21/07/2006, 11h06
  5. problème de MOT DE PASSE avec mysql
    Par u_brush_u dans le forum Requêtes
    Réponses: 3
    Dernier message: 11/07/2006, 13h35

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo