|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | |
![]() ![]() Guillaume RossoliniDirecteur technique Inscription : février 2004 Messages : 13 722 ![]() |
Bonsoir,
Voici un article que je ne parviens pas à finaliser dans le détail, mais qui me semble suffisamment avancé pour vous le présenter sans trop rougir : Configurer un moteur de recherche performant à l'aide d'Apache Lucene/Solr et Apache Tomcat (ou tout autre conteneur de servlets) Citation:
De même, la rédaction a commencé alors que Tomcat 5.5 était encore assez répandu, et la branche 7 n'était pas encore sortie. N'hésitez pas à laisser vos commentaires à la suite, surtout si vous avez comparé divers moteurs full-text et que vous souhaitez partager votre expérience. Bonne lecture !
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework) Ressources PHP - Ressources Zend Framework |
|
|
|
40
|
|
|
#2 |
![]() ![]() ![]() Idriss NeumannConsultant en SSII et auditeur au CNAM Paris (ingénieur SI) Inscription : février 2009 Messages : 3 794 ![]() |
Bonjour.
Merci pour ce cours qui semble très complet et d'un bon niveau, c'est exactement ce dont j'avais besoin (j’entends de plus en plus parler de Solr sans savoir exactement ce que c'est, bien sûr avec une petite idée mais ...). Je n'ai pas eu le temps de le parcourir en profondeur mais je le ferait dès que j'aurais un peu temps où en cas de besoin.Merci encore. Cordialement, Idriss |
|
00
|
|
|
#3 |
|
Nouveau Membre du Club
![]() Thibaud Vibes Inscription : juin 2008 Messages : 13 ![]() |
Un travail impressionnant! Merci.
J'aurais une remarque sur le vocabulaire dans le paragraphe I-B ;-) La traduction de stemming n'est pas lemmatisation mais stemmatisation ou racinisation. Les 2 traitements sont légèrements différents et ce qui est décrit dans le paragraphe I-B-2-b est bien la racinisation des mots (mot -> lexème ou racine ou radical). Et c'est bien ce que Solr effectue comme traitement. La lemmatisation (mot -> lemme) consiste à ramener un mot à sa forme canonique, c'est à dire la plus petite unité de sens. Ce sera la forme "singulier" pour un nom, la forme infinitive pour un verbe. Les dictionnaires par exemples recensent tous les lemmes d'une langues. Voici un exemple qui illustre la différence entre les 2. Prenons 3 mots : augmenter / augmentez / augmentation La lemmatisation donne 2 lemmes : augmenter / augmentation La racinisation(stemmatisation) donne 1 lexème : augment Seule la racinisation permet de rapprocher les 3 mots et est donc plus efficace dans Solr. Je pense donc qu'il est plus juste d'intituler votre paragraphe "Racinisation" que "Lemmatisation". Voir la page wikipedia sur la racinisation http://fr.wikipedia.org/wiki/Racinisation A noter qu'il est plus difficile de mettre au point en informatique un lemmatiseur qu'un raciniseur car lemmatiser un mot dépend beaucoup de sa fonction grammaticale. Il y a beaucoup de cas où il y a ambiguïté. Ex: "je marche" => lemme: marcher "les marches de l'escalier" => lemme: marche Le raciniseur |
|
20
|
|
|
#4 |
|
Membre Expert
![]() ![]() Inscription : novembre 2002 Messages : 328 ![]() |
Bonjour Yogui,
Bravo pour se travaille, c'est complet est fort intéressant. J’aurais bien aimé avoir lu ton article avant d'attaquer la documentation de Solr, j'aurais gagné du temps. Dans le chapitre 8 tu dis que le Suggester nécessite un reload, cela ne semble pas se produire dans mon cas avec la dernière version. Pour ceux qui veulent voir ce que cela peut donner dans un cas réél avec les modules de l'articles: suggestion, facet, highlight et full text le tout en ajax http://www.jardiland.com/information...he.html#erable Les performances sont très bonnes. SOLR est un outils mature et intéressant. |
|
|
00
|
|
|
#5 |
![]() ![]() Guillaume RossoliniDirecteur technique Inscription : février 2004 Messages : 13 722 ![]() |
@tvibes : Eh bien pourtant, je me suis renseigné pendant un bon moment et j'ai fait relire spécialement cette partie de l'article. Merci pour avoir relevé cette coquille, c'est corrigé.
@request : ma foi, j'aurais moi aussi avoir eu un cours d'intro un peu plus facile d'approche que le tuto qui était disponible sur le Wiki officiel à l'époque J'espère que mon article est un élément de réponse à ce problème.
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework) Ressources PHP - Ressources Zend Framework |
|
|
00
|
|
|
#6 |
|
Nouveau Membre du Club
![]() Thibaud Vibes Inscription : juin 2008 Messages : 13 ![]() |
@Yogui @request Quand j'ai commencé avec Solr j'ai acheté le EBook
Solr 1.4 - Enterprise Search Server (moins de 30€ il me semble) Il m'a été d'une grande aide. |
|
10
|
|
|
#7 |
![]() ![]() Guillaume RossoliniDirecteur technique Inscription : février 2004 Messages : 13 722 ![]() |
En effet, j'en ai fait l'acquisition également pour mes débuts. Les publications de LucidWorks sont aussi très utiles, surtout que Yonik est (encore aujourd'hui) très actif sur la mailing list officielle, il sait donc très bien de quoi il parle ! Malheureusement, comme toute documentation, ces publications (ainsi que la mienne) perdent peu à peu de leur fraîcheur...
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework) Ressources PHP - Ressources Zend Framework |
|
|
00
|
|
|
#8 | |
|
Membre actif
![]() Jean-François Développeur Web Inscription : février 2003 Messages : 132 ![]() |
Citation:
Super ton interface ! C'est un code issue d'un projet open source qu'on peut se procurer quelque part ? ou est-ce fait maison ? Merci |
|
|
|
00
|
|
|
#9 |
|
Invité de passage
![]() Inscription : avril 2012 Messages : 1 ![]() |
Bonjour,
Merci beaucoup pour ce tuto vraiment complet et utile pour débuter. Arès avoir buté sur un point, il me semble que le schéma décrit à la section IV-A-2-3 ne peut pas fonctionner car les champs "allEnSearch" et "allFrSearch" ne sont pas déclarés avec multiValued="true". J'ai dû ajouter ce paramètre pour que l'import du xml se déroule sans erreur. Comme je débute tout juste sur Solr je dis peut-être une bêtise. |
|
|
00
|
|
|
#10 |
|
Nouveau Membre du Club
![]() Thibaud Vibes Inscription : juin 2008 Messages : 13 ![]() |
@nils nicolas
Je confirme. L'utilisation de 2 <copyField /> pour chacun des champs "allEnSearch" et "allFrSearch" (paragraphe IV-C) rend obligatoire la déclaration multiValued="true" ![]() -- Edit -- A la décharge de Yogui, le schemas.xml fourni dans le *.zip (paragraphe VIII-C) contient bien les multiValued="true" |
|
00
|
|
|
#11 |
![]() ![]() Guillaume RossoliniDirecteur technique Inscription : février 2004 Messages : 13 722 ![]() |
@nils nicolas, @tvibes :
Merci pour vos justes remarques. Je corrigerai sous peu (petit problème temporaire avec l'outil de génération/upload de l'article).
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework) Ressources PHP - Ressources Zend Framework |
|
|
00
|
Copyright © 2000-2013 - www.developpez.com