[Solr] le mot le plus rare avec le plus haut de privilégié

**cupidcb** · 06/01/2012, 16h56

Comme j'ai toujours pas trouvé comment créer un nouveau discussion. Je profite ce discussion pour poser ma question sur le configuration du Solr.

Je vous explique mon cas :
------------------------------------

Les données ce que j'ai indexé (exemple):
1. Auchan
2. Magasin Carrefour
3. Magasin LIDL

Les données ce que je veux chercher c'est Magasin Auchun
(ici, j'ai changé la lettre a à u, parce que quand on saisit les mots, on peut pas sur c'est correct ou pas).

Le résultat ce que je veux c'est Auchan, mais solr, il m'a retourné le Magasin Carrefour, avec le score le plus haut.

Est-ce qu'on peut changer, par exemple, l'url ou le schema, ou le solrconfig pour faire le mot le plus rare avec le plus haut de privilégié ???

Je fournis le schema.xml ici, et le solrconfig.xml c'est comme tout les autres.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
<?xml version="1.0" encoding="UTF-8" ?>
<schema name="example" version="1.2">
  <types>
    <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
    <fieldType name="nGram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
    <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory" />
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    </analyzer>
    </fieldType>
 </types>
 <fields>
   <field name="id" type="string" indexed="true" stored="true" required="true" />
   <field name="fulltext_client" type="nGram" indexed="true" stored="true" />
   <field name="fulltext_cedex" type="text" indexed="true" stored="true" />
   <field name="fulltext_voie" type="text" indexed="true" stored="true" />
   <field name="fulltext_commune" type="text" indexed="true" stored="true" />
  </fields>
 <uniqueKey>id</uniqueKey>
 <defaultSearchField>fulltext_client</defaultSearchField>
 <solrQueryParser defaultOperator="OR"/>
 
</schema>

J’attends un superman !!

Merci à l'avance ! Bo

**ThomasR** · 06/01/2012, 17h25

Bonjour,

Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

Une aide d'un expert Solr serait la bienvenue.

**cupidcb** · 06/01/2012, 18h51

Envoyé par ThomasR

Bonjour,

Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

Une aide d'un expert Solr serait la bienvenue.

Merci Thomas !

Tout abord, ajoute Auchun en synonyme, c'est peut-etre pas possible parce que si on a une grosse de donnée (20G par exemple), imagine qu'est ce que ça va passer

Pour moi, en fait, j'ai utilisé le score(fl=*,score), ce que je prefère, c'est Auchan qui peut avoir un score plus haut que Magasin.

Donc j'ai dit le privilégie, mais c'est peut-etre pas ça...

Bo

[Solr] le mot le plus rare avec le plus haut de privilégié

EDI, CMS, Outils, Scripts et API PHP

Discussions similaires

Partager

Partager