IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PHP & Base de données Discussion :

Moteur de recherche / Lucène


Sujet :

PHP & Base de données

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Août 2009
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2009
    Messages : 25
    Par défaut Moteur de recherche / Lucène
    Bonjour,

    Je cherche à developpé (ou intégré) un moteur de recherche basé sur une infrastucture PHP / MySQL.

    Le système en place pour le moment utilise des indexs FULL-TEXT sur différents champs.
    Un cron se charge de regrouper tout ces indexes pertinent pour une recherche (nom,auteur et descritipion) dans un même champ afin d'accélérer le requêtage.
    Enfin, le moteur requête sur ce champ et retourne une liste de résultat trié par pertinence.

    Cependant, ce système montre ses limites:
    Le mot Lirve ne matchera pas sur le mot Livre.
    Les pluriels et les abréviation ne match pas.
    Le scalling en taille risque d'être assez mauvais, le site ayant pour objectif de contenir des dixaines voir centaines de milliers d'articles.
    Enfin, la pertinence n'est pas toujours excellente sur les recherches.

    Je cherche donc un moyen d'améliorer cette fonction de recherche.
    Etant donné que les fonctionnalités que je tente de menttre en place sont assez poussés, je pensais me tourner vers une librairie déjà existante.
    Le problème est que je n'ais trouvé uniquement que des moteur de recherche couplé à des crawler, qui vont crawler mon site puis indexer le contenu dans des fichiers et faire leur petite popote pour me retourner les résultats par la suite.

    Je cherche plutôt pour ma part un moteur qui viendrait se greffer sur ma BDD en requêtant un ou plusieurs champs, car il me semble inutile et coûteux aussi bien en terme de place que de pertinance d'allez crawler des pages dont les seules éléments importants à rechercher sont définis dans un nombre finis de champs en BDD.

    Je me suis intérressé à certains moteur et plus particulièrement à Lucène qui semble extrèmement performant (du niveau d'un petit Google et OpenSource).
    Cependant après avoir parcourut différents posts et docs à son sujet il me semble que ce dernier crawl les informations pour les requêter par la suite, ce qui ne m'interresse pas à prioris.

    Suis-je sur une mauvais piste en tentant de trouver un moteur de recherche performant se greffant sur une BDD ? Faut il plutôt tenter d'intégrer un crawler/search engine complet quitte à consommer de la ressource inutilement en indexant du contenu non pertinant et/ou déjà existant en BDD ?

    Merci d'avance

  2. #2
    Membre Expert
    Homme Profil pro
    Inscrit en
    Septembre 2006
    Messages
    2 963
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Septembre 2006
    Messages : 2 963
    Par défaut
    Regardez aussi Apache Solr…

Discussions similaires

  1. Moteur de recherche Lucéne
    Par menzlitsh dans le forum API standards et tierces
    Réponses: 0
    Dernier message: 30/07/2010, 13h33
  2. [Info]moteur de recherche full text en environnement j2ee
    Par ddams dans le forum API standards et tierces
    Réponses: 4
    Dernier message: 03/11/2004, 19h39
  3. comment faire ma base de donnée pour un moteur de recherche
    Par HoB dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 04/05/2004, 15h07
  4. Moteur de recherche par date
    Par Prue dans le forum ASP
    Réponses: 17
    Dernier message: 27/08/2003, 16h07
  5. [Technique] Index, comment font les moteurs de recherche ?
    Par bat dans le forum Décisions SGBD
    Réponses: 4
    Dernier message: 25/10/2002, 15h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo