IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SQL Procédural MySQL Discussion :

Indexation full-text le bon choix ?


Sujet :

SQL Procédural MySQL

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2007
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 20
    Points : 8
    Points
    8
    Par défaut Indexation full-text le bon choix ?
    Bonjour à tous

    J'utilise depuis plusieurs années déjà la recherche full-text pour mes données, j'en suis assez satisfait, mais j'ai du mettre en place plusieurs restrictions pour ne pas faire tomber mon serveur.

    Je me pose quelques questions suite à la lecture de cette page : Indexation documentaire & bases de données

    Je suis en train de mettre en place un system quasi identique, et je me pose de plus en plus de questions à propos de la performance de cette méthode, et sur les possibilités de tries des données (principalement: la possibilité de faire remonter en premier les textes ayant le plus grand nombre de fois le mot rechercher.)
    Ce qui m'attire dans cette méthode c'est la possibilité de traiter chaque mot indépendament, pour par exemple leur attribuer un status.

    la table texte comprendra entre 2 et 10 millions de lignes
    la table mot comprendra dans les 150 à 300 milles mots.

    A votre avis quel modèle de données sera le plus performant : la recherche full text ou bien l'indexation des mots et une table de référence ?

    Merci !

  2. #2
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2007
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 20
    Points : 8
    Points
    8
    Par défaut
    Ma question n'est pas assez précise ? Ou bien personne n'a fait ce genre de test ?

  3. #3
    Membre éprouvé
    Avatar de Sivrît
    Profil pro
    Inscrit en
    Février 2006
    Messages
    953
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2006
    Messages : 953
    Points : 1 249
    Points
    1 249
    Par défaut
    La question est plutôt propre, mais je soupçonne que peu de monde par ici ait vraiment de l'expérience avec les indexes FULLTEXT. Du coup on se sent un peu timides pour conseiller quelqu'un qui a passé quelques années dessus

    Personnellement je n'ai guère trouvé que http://www.pui.ch/phred/archives/200...e-schemas.html et http://www.pui.ch/phred/archives/200...nce-tests.html qui concernent uniquement des tags et trouve que ça dépend de la répartition/sélectivité des mots. L'idée de cumuler les deux système pourrait être intéressante pour ce qui est de lier des données aux mots.

    Cependant je n'ai pas l'impression (mais c'est vraiment un avis) que l'une ou l'autre des solutions change l'ordre de grandeur des performances. Pour cela il faudrait peut-être regarder du côté de solutions externes comme sphinx ou lucene par exemple.

    Voilà pour mes 3 centimes.

  4. #4
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2007
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 20
    Points : 8
    Points
    8
    Par défaut
    Les liens que tu à donné sont très intéressants, et répondent en partie à mes questions, les méthodes par tags ne semblent pas vraiment adapter aux gros volume de données, la performance baisse de façon exponentiel pour les tags alors que le full text baisse de façon linéaire.

    Lucene et sphinx sont certainement plus performant mais la mise en place et l'utilisation sont beaucoup plus contraignantes.

    Au final je vais certainement utiliser les 2 systèmes, car les deux ont des avantages, je vais faire des tests et voir par moi même si la baisse de performance est acceptable... ou pas.


    J'utilise depuis plusieurs années la recherche full text, mais je ne suis pas un expert loin de là ^^

    D'ailleurs si quelqu'un peut m'indiquer ou mettre le fichier du paramètre ft_stopword_file ça m'interesse !

    ft_stopword_file = "stopword.txt" ?
    ou bien
    ft_stopword_file = "/chemin/vers/stopword.txt" ?

    Merci !

  5. #5
    Membre à l'essai
    Inscrit en
    Août 2007
    Messages
    18
    Détails du profil
    Informations forums :
    Inscription : Août 2007
    Messages : 18
    Points : 13
    Points
    13
    Par défaut
    Salut tous :
    Je suis à la recherche d'autres méthodes d'indexation qu'lqu'un peut m'aider???

Discussions similaires

  1. Erreur sur champ text pour un index Full-Text
    Par Steph82 dans le forum Outils
    Réponses: 5
    Dernier message: 06/01/2011, 14h08
  2. supprimer des index full text
    Par galsen3 dans le forum Administration
    Réponses: 1
    Dernier message: 16/06/2009, 06h20
  3. Sql serveur 2005 et index full texte
    Par gueguenkevin dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 09/01/2008, 21h12
  4. Problème index Full text
    Par fumesec dans le forum SQL Procédural
    Réponses: 1
    Dernier message: 29/09/2007, 09h59
  5. Index full text sur champs multiples
    Par manu_71 dans le forum Outils
    Réponses: 6
    Dernier message: 22/02/2007, 00h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo