IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage SQL Discussion :

Stratégie pour un moteur de recherche évolué


Sujet :

Langage SQL

  1. #1
    Expert éminent
    Avatar de berceker united
    Profil pro
    SQL
    Inscrit en
    Février 2005
    Messages
    3 488
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : SQL
    Secteur : Finance

    Informations forums :
    Inscription : Février 2005
    Messages : 3 488
    Points : 6 037
    Points
    6 037
    Par défaut Stratégie pour un moteur de recherche évolué
    Bonjour,
    Faisant un site e-commerce, je me penche sur la derniere partie du projet en SQL. Maintenant, je me penche sur la stratégie d'un moteur de recherche évolué.
    Voila à quoi je pense. J'ai un objet type "produit". Je voudrais y associer un certain nombre de mots clés.
    Exemple : Produit : Ordinateur Portable DELL. Je veux associer le mot clés suivant : Ordinateur, portable, DELL, batterie, 15 pouces , PCMCIA.
    Mais en plus, comme je sais qu'il y en a qui ont des moufles au mains, chaque mot à des dérivés. C'est à dire :
    Dell > del > delle.
    15 pouces > 15p > 15"
    ...
    Donc un mot peut avoir une liste de mot dérivé orthographique. Mais un mot peut être un dérivé d'un autre mot. Exemple : Ultraportable dérive de Ordinateur portable qui lui dérive de Ordinateur. En gros
    Racine
    ....|_Ordinateur
    .........|_Ordinateur portable
    ..............|_Ultraportable

    Ce qui signifie que un objet est associé à un mot ainsi qu'a tout les enfants de ce mot mais pas au parent.

    Autre point. Chaque association d'un objet à un mot clé à un scoring entre 1 et 100. En effet, chaque objet peuvent partager le même mot clés mais ils sont pas pour autant égaux devant ce mot.

    Mon but final est de ne pas utiliser de fonction de recherche type LIKE.
    Que l'utilisateur puisse maitriser totalement la pertinence d'un produit pour le moteur de recherche.
    Ma question est de savoir si je risque pas de me retrouver fasse à un problème logique ou technique ? Est-ce bien de raisonner dans ce sens est-ce une bonne stratégie?
    Merci
    Mon avatar ? Ce n'est rien, c'est juste la tête que je fais lorsque je vois un code complètement frappa dingue !...

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    500
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Juillet 2007
    Messages : 500
    Points : 639
    Points
    639
    Par défaut
    Ca a l'air très intéressant comme projet, et je pense que tu as quelques nuits blanches en perspective pour cette nouvelle année.

    De 2 choses l'une, et ce n'est pas précisé dans ton énoncé par ailleurs très clair :
    • soit le besoin se limite à ce que un produit est trouvé par le moteur de recherche à la condition que le mot clé saisi corresponde strictement à l'un des mots dérivés stockés, quel que soit sa position dans la hiérarchie (del ou delle trouvent Ordinateur Portable DELL parce que del et delle sont dans la liste des mots dérivés, mais dele par exemple ne trouverait pas) : dans ce cas, je pense qu'il faut bien réfléchir à la modélisation des données, à comment modéliser les rapports père/fils et définir combien de niveau max on peut avoir. Ne pas bacler cette étape, mais c'est très possible techniquement, et avec un bon modèle, tu pourras derrière écrire des requêtes SQL performantes.
    • soit le besoin est qu'un produit est également trouvé par le moteur de recherche par des mots clés non existants dans la liste des mots dérivés stockés, mais approchants à l'un d'eux (dans l'exemple, dele fonctionnerait grâce à un like 'del%', ou dhell fonctionnerait car une seul lettre diffère (il existe des algos pour ça qui rapprochent les mots après avoir simplifié leur écriture en les codant avec quelques grandes familles de lettre (ex : c, s, g, k, q, x, ... devient c))) : dans ce cas, la même réflexion sur le modèle des données va s'imposer, mais la variété des requêtes à écrire n'a pas de limite, et les temps de traitements risquent de ne pas en avoir non plus. Bref, ça peut vité dégénérer...
    Des chercheurs qui cherchent, on en trouve, mais des chercheurs qui trouvent, on en cherche !

  3. #3
    Expert éminent
    Avatar de berceker united
    Profil pro
    SQL
    Inscrit en
    Février 2005
    Messages
    3 488
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : SQL
    Secteur : Finance

    Informations forums :
    Inscription : Février 2005
    Messages : 3 488
    Points : 6 037
    Points
    6 037
    Par défaut
    Merci pour ton intervention.
    Effectivement, dans mon cas il faut que le mot recherché soit bien présente dans la base de données dans le sens stricte. Elle peut être compensé en rendant la base de données très riche.

    Pour la gestion des niveaux, j'ai trouvé un moyen pour ne pas faire des requêtes en boucle ou des calcules complexe. C'est d'utiliser un champs ayant la trace génétique de tout ses parents.
    Parent : 001
    ...|_Fils 001.001
    ...|_Fils 001.002
    ......|_Fils 001.002.001

    Ainsi, ça me permet de faire une recherche en aval ou en amont via la methode LIKE. Ainsi, je ne donne pas de contrainte de niveau.

    En même temps, je me pose la question pour trouver un systeme intéligent qui permet d'insérer automatiquement les mots dérivé associés au fil du temps d'utilisation de l'application.
    Mon avatar ? Ce n'est rien, c'est juste la tête que je fais lorsque je vois un code complètement frappa dingue !...

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 768
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 768
    Points : 52 719
    Points
    52 719
    Billets dans le blog
    5
    Par défaut
    Vous n'êtes pas du tout dans la bonne stratégie. Il ne faut pas recenser toutes les combinaisons des mots, car si vos utilisateurs sont dislexiques alors pour un mot comme "anticonstitutionnellement" il faudrait quelques 15511210043330985984000000 combinaisons (factorielle 25). Autant dire que pour tous les mots il vous faudra un SGBDR ayant une capacité de 354 067 158 650 894 165 Téra octets... (pour un thésausus de 25 000 mots).

    Lisez l'aticle que j'ai écrit sur la sujet : http://sqlpro.developpez.com/cours/indextextuelle/
    completez votre lecture avec ce papier là : http://sqlpro.developpez.com/cours/s...aisons-motifs/

    implémentez un algorithme de proposition de corrections basée sur une combinaison de l'algorithme du dico de KNUT et d'un des codes correcteur proposé dans le second papier.
    C'est ce que fait google.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  5. #5
    Expert éminent
    Avatar de berceker united
    Profil pro
    SQL
    Inscrit en
    Février 2005
    Messages
    3 488
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : SQL
    Secteur : Finance

    Informations forums :
    Inscription : Février 2005
    Messages : 3 488
    Points : 6 037
    Points
    6 037
    Par défaut
    En faite, non. Je n'étais pas partie sur le faite de trouver toute les combinaisons possible pour un mot. Mais que pour un mot précis il arrive souvent que les mêmes erreurs surviennent. Donc je propose à l'utilisateur d'y associer un certain nombre pouvant correspondre au mot racine recherché.

    Dans le cas d'un site e-commerce la stratégie est un peut différente. Nous sommes obligé de demander à l'internaute de faire un effort pour trouver un mot assez cohérant.
    Après, à l'utilisateur de données l'information que lui voudrait bien montrer en premier par rapport au mot demandé.
    Un internaute cherche un ultraportable l'utilisateur va faire en sorte que ce mot soit fortement lié à un ultraportable asus model xxx.
    C'est ce genre de moteur que je veux faire car c'est commercial et non pas sur un contenu d'un document.


    Dans l'article lu j'ai vu des choses intéressantes.
    Mon avatar ? Ce n'est rien, c'est juste la tête que je fais lorsque je vois un code complètement frappa dingue !...

  6. #6
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 768
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 768
    Points : 52 719
    Points
    52 719
    Billets dans le blog
    5
    Par défaut
    Alors il s'agit de mots associés de synonymes...

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  7. #7
    Expert éminent
    Avatar de berceker united
    Profil pro
    SQL
    Inscrit en
    Février 2005
    Messages
    3 488
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : SQL
    Secteur : Finance

    Informations forums :
    Inscription : Février 2005
    Messages : 3 488
    Points : 6 037
    Points
    6 037
    Par défaut
    Oui et non. Il y a en effet un dérivé d'ordre synonimes et pour un mot il y a un version orthographié différement. A l'utilisateur de placer ces mots là.
    D'un autre coté vu que je fais une application gratuite je vais pas me lancer sur un moteur de recherche 16 soupapes
    Mon avatar ? Ce n'est rien, c'est juste la tête que je fais lorsque je vois un code complètement frappa dingue !...

Discussions similaires

  1. [MySQL] Base de données : stratégie à adopter pour un moteur de recherche
    Par yohan0262 dans le forum PHP & Base de données
    Réponses: 10
    Dernier message: 04/06/2007, 11h35
  2. selection date ou VIDE pour un moteur de recherche
    Par popofpopof dans le forum VBA Access
    Réponses: 4
    Dernier message: 16/05/2007, 07h29
  3. Réponses: 7
    Dernier message: 03/04/2007, 20h57
  4. [SQL] Aide pour un moteur de recherche
    Par Death83 dans le forum PHP & Base de données
    Réponses: 15
    Dernier message: 26/10/2005, 14h12
  5. comment faire ma base de donnée pour un moteur de recherche
    Par HoB dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 04/05/2004, 15h07

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo