IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

EDI, CMS, Outils, Scripts et API PHP Discussion :

[Solr] le mot le plus rare avec le plus haut de privilégié


Sujet :

EDI, CMS, Outils, Scripts et API PHP

  1. #1
    Candidat au Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2010
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2010
    Messages : 6
    Points : 4
    Points
    4
    Par défaut [Solr] le mot le plus rare avec le plus haut de privilégié
    Comme j'ai toujours pas trouvé comment créer un nouveau discussion. Je profite ce discussion pour poser ma question sur le configuration du Solr.

    Je vous explique mon cas :
    ------------------------------------

    Les données ce que j'ai indexé (exemple):
    1. Auchan
    2. Magasin Carrefour
    3. Magasin LIDL

    Les données ce que je veux chercher c'est Magasin Auchun
    (ici, j'ai changé la lettre a à u, parce que quand on saisit les mots, on peut pas sur c'est correct ou pas).

    Le résultat ce que je veux c'est Auchan, mais solr, il m'a retourné le Magasin Carrefour, avec le score le plus haut.

    Est-ce qu'on peut changer, par exemple, l'url ou le schema, ou le solrconfig pour faire le mot le plus rare avec le plus haut de privilégié ???

    Je fournis le schema.xml ici, et le solrconfig.xml c'est comme tout les autres.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    <?xml version="1.0" encoding="UTF-8" ?>
    <schema name="example" version="1.2">
      <types>
        <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
        <fieldType name="nGram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
        <analyzer type="index">
            <tokenizer class="solr.StandardTokenizerFactory" />
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
            <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="solr.StandardTokenizerFactory"/>
            <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
            <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        </analyzer>
        </fieldType>
     </types>
     <fields>
       <field name="id" type="string" indexed="true" stored="true" required="true" />
       <field name="fulltext_client" type="nGram" indexed="true" stored="true" />
       <field name="fulltext_cedex" type="text" indexed="true" stored="true" />
       <field name="fulltext_voie" type="text" indexed="true" stored="true" />
       <field name="fulltext_commune" type="text" indexed="true" stored="true" />
      </fields>
     <uniqueKey>id</uniqueKey>
     <defaultSearchField>fulltext_client</defaultSearchField>
     <solrQueryParser defaultOperator="OR"/>
     
    </schema>
    J’attends un superman !!

    Merci à l'avance ! Bo

  2. #2
    Membre expert
    Avatar de ThomasR
    Homme Profil pro
    Directeur technique
    Inscrit en
    Décembre 2007
    Messages
    2 230
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Directeur technique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Décembre 2007
    Messages : 2 230
    Points : 3 972
    Points
    3 972
    Par défaut
    Bonjour,

    Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
    Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

    Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

    Une aide d'un expert Solr serait la bienvenue.

  3. #3
    Candidat au Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2010
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2010
    Messages : 6
    Points : 4
    Points
    4
    Par défaut
    Citation Envoyé par ThomasR Voir le message
    Bonjour,

    Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
    Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

    Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

    Une aide d'un expert Solr serait la bienvenue.
    Merci Thomas !

    Tout abord, ajoute Auchun en synonyme, c'est peut-etre pas possible parce que si on a une grosse de donnée (20G par exemple), imagine qu'est ce que ça va passer

    Pour moi, en fait, j'ai utilisé le score(fl=*,score), ce que je prefère, c'est Auchan qui peut avoir un score plus haut que Magasin.

    Donc j'ai dit le privilégie, mais c'est peut-etre pas ça...

    Bo

Discussions similaires

  1. Réponses: 13
    Dernier message: 09/04/2015, 15h43
  2. Jeu le mot le plus long avec Tkinter
    Par calaca dans le forum Tkinter
    Réponses: 12
    Dernier message: 10/12/2013, 19h16
  3. [video Humour]Le meurtre le plus long et le plus atroce avec l'arme la plus inefficace !
    Par Lyche dans le forum La taverne du Club : Humour et divers
    Réponses: 18
    Dernier message: 01/02/2010, 08h57
  4. Réponses: 8
    Dernier message: 27/11/2009, 12h13
  5. listage de triggers/sequences avec sql plus
    Par stross dans le forum Oracle
    Réponses: 52
    Dernier message: 20/04/2004, 15h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo