Précédent   Forum des professionnels en informatique > PHP > Outils
Outils Forum d'entraide sur les outils pour développeurs PHP : EDI, installation, administration... Avant de poster : FAQ outils, toutes les FAQ PHP et les comparatifs
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 06/01/2012, 16h56   #1
 
Homme Bo
Développeur informatique
Inscription : octobre 2010
Messages : 7
Détails du profil
Informations personnelles :
Nom : Homme Bo
Localisation : France

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : octobre 2010
Messages : 7
Points : -1
Points : -1
Par défaut [Solr] le mot le plus rare avec le plus haut de privilégié

Comme j'ai toujours pas trouvé comment créer un nouveau discussion. Je profite ce discussion pour poser ma question sur le configuration du Solr.

Je vous explique mon cas :
------------------------------------

Les données ce que j'ai indexé (exemple):
1. Auchan
2. Magasin Carrefour
3. Magasin LIDL

Les données ce que je veux chercher c'est Magasin Auchun
(ici, j'ai changé la lettre a à u, parce que quand on saisit les mots, on peut pas sur c'est correct ou pas).

Le résultat ce que je veux c'est Auchan, mais solr, il m'a retourné le Magasin Carrefour, avec le score le plus haut.

Est-ce qu'on peut changer, par exemple, l'url ou le schema, ou le solrconfig pour faire le mot le plus rare avec le plus haut de privilégié ???

Je fournis le schema.xml ici, et le solrconfig.xml c'est comme tout les autres.

Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
<?xml version="1.0" encoding="UTF-8" ?>
<schema name="example" version="1.2">
  <types>
    <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
    <fieldType name="nGram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
    <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory" />
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="100"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    </analyzer>
    </fieldType>
 </types>
 <fields>
   <field name="id" type="string" indexed="true" stored="true" required="true" />
   <field name="fulltext_client" type="nGram" indexed="true" stored="true" />
   <field name="fulltext_cedex" type="text" indexed="true" stored="true" />
   <field name="fulltext_voie" type="text" indexed="true" stored="true" />
   <field name="fulltext_commune" type="text" indexed="true" stored="true" />
  </fields>
 <uniqueKey>id</uniqueKey>
 <defaultSearchField>fulltext_client</defaultSearchField>
 <solrQueryParser defaultOperator="OR"/>
 
</schema>
J’attends un superman !!

Merci à l'avance ! Bo
cupidcb est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/01/2012, 17h25   #2
Modérateur
 
Avatar de ThomasR
 
Homme Thomas Rambaud
Développeur Web
Inscription : décembre 2007
Messages : 2 140
Détails du profil
Informations personnelles :
Nom : Homme Thomas Rambaud
Âge : 25
Localisation : France

Informations professionnelles :
Activité : Développeur Web
Secteur : High Tech - Multimédia et Internet

Informations forums :
Inscription : décembre 2007
Messages : 2 140
Points : 2 885
Points : 2 885
Bonjour,

Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

Une aide d'un expert Solr serait la bienvenue.
__________________
Développeur Web, accessoirement geek (ou l'inverse)
http://thomasrambaud.com
ThomasR est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/01/2012, 18h51   #3
 
Homme Bo
Développeur informatique
Inscription : octobre 2010
Messages : 7
Détails du profil
Informations personnelles :
Nom : Homme Bo
Localisation : France

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : octobre 2010
Messages : 7
Points : -1
Points : -1
Citation:
Envoyé par ThomasR Voir le message
Bonjour,

Ce que tu souhaites ce n'est pas privilégier le mot le plus rare, c'est juste que Auchun soit apparenté à Auchan pour le moteur.
Je sais que Lucene.net (solr pour ASP.net si on veut) le fait par défaut...

Sinon tu peux aussi ajouter Auchun en synonyme de Auchan dans ton fichier synonym.txt mais bon...

Une aide d'un expert Solr serait la bienvenue.
Merci Thomas !

Tout abord, ajoute Auchun en synonyme, c'est peut-etre pas possible parce que si on a une grosse de donnée (20G par exemple), imagine qu'est ce que ça va passer

Pour moi, en fait, j'ai utilisé le score(fl=*,score), ce que je prefère, c'est Auchan qui peut avoir un score plus haut que Magasin.

Donc j'ai dit le privilégie, mais c'est peut-etre pas ça...

Bo
cupidcb est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 04h27.


 
 
 
 
Partenaires

Hébergement Web