Précédent   Forum des professionnels en informatique > Bases de données > Décisions SGBD
Décisions SGBD Forum de décisions sur le choix en bases de données. Le Comparatif
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 05/07/2007, 16h25   #1
Invité de passage
 
Inscription : juillet 2007
Messages : 3
Détails du profil
Informations personnelles :
Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

Informations forums :
Inscription : juillet 2007
Messages : 3
Points : 2
Points : 2
Par défaut Quel SGBD choisir pour la recherche full texte ?

Bonjour,

Je participe actuellement au développement d'un site web permettant l'hébergement de documents texte (pdf, MS office, Open Office, ...). Je souhaite faire de la recherche plein texte mais uniquement sur les documents d'un utilisateur à la fois. Effectivement la recherche full text ne servira qu'à chercher parmis SES propes documents.
Le nombre de documents hébergés va devenir important (plusieurs millions, j'espère!). Il est a noter que les documents NE doivent PAS être sauvé dans la base. La base doit analyser le contenu du document (transformé en plein texte) et construire l'index. Enfin, je souhaite que dès qu'un utilisateur upload un document, celui-ci soit accessible immédiatement en recherche (pas de phase d'indexation périodique).
Je cherche une solution basé sur une base de données pour faire ses recherches.

Voici l'état de mes recherches:
MYSQL:
- La recherche Full Text est très lente dès qu'on utilise des clauses WHERE (indispensable pour avoir que les docs d'un utilisateur).
- impossible de créer une table ou une base par utilisateur pour des raisons de performance et de limitations par MySQL

SQLite:
+ permet de créer une BD par user
- Cette solution semble nécessiter le stockage du document dans la BD

Postgres:
- Cette solution semble nécessiter le stockage du document dans la BD

Solutions sans BD:
Lucene:
- nous souhaitons eviter de mettre JAVA sur les machines si possible
- pb de perf avec un grand nombre de documents si il y a qu'un seul index

Sphinx:
- indexation manuelle
camilleroux est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/07/2007, 16h05   #2
Rédacteur/Modérateur
 
Avatar de fadace
 
Homme Fabien Celaia
Administrateur de base de données
Inscription : octobre 2002
Messages : 3 779
Détails du profil
Informations personnelles :
Nom : Homme Fabien Celaia
Âge : 41
Localisation : Suisse

Informations professionnelles :
Activité : Administrateur de base de données
Secteur : Service public

Informations forums :
Inscription : octobre 2002
Messages : 3 779
Points : 8 124
Points : 8 124
Envoyer un message via ICQ à fadace Envoyer un message via Skype™ à fadace
Oracle, MS-SQL, Sybase ASE... tous ces SGBDR ont du FTS
__________________
Sr DBA Oracle / Sybase / MS-SQL / DB2 / Informix / Postgresql
Administrateur SAP
Mes articles

Attention : pas de réponse technique par MP : pensez aux autres, passez par les forums !
fadace est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 09/07/2007, 17h13   #3
Membre du Club
 
Avatar de balmeyer
 
Inscription : mars 2004
Messages : 83
Détails du profil
Informations personnelles :
Âge : 37

Informations forums :
Inscription : mars 2004
Messages : 83
Points : 53
Points : 53
Pour Postgresql, quel serait le meilleur outil de recherche full-text ?
balmeyer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/08/2007, 14h56   #4
Rédacteur/Modérateur

 
Avatar de SQLpro
 
Homme Frédéric BROUARD
Expert SGBDR & SQL
Inscription : mai 2002
Messages : 10 959
Détails du profil
Informations personnelles :
Nom : Homme Frédéric BROUARD
Localisation : France

Informations professionnelles :
Activité : Expert SGBDR & SQL
Secteur : Conseil

Informations forums :
Inscription : mai 2002
Messages : 10 959
Points : 17 793
Points : 17 793
rien ne vaut une indexation textuelle spécifique. En effet la norme SQL est trop cadrée sur le sujet et les solutions des éditeurs trop pauvres pour faîre ce que vous voulez.

Lisez donc l'article que j'ai écrit à ce sujet :
http://sqlpro.developpez.com/cours/indextextuelle/

A +
__________________
Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
Site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
Blog SQL, SQL Server, modélisation données : http://blog.developpez.com/sqlpro
http://www.sqlspot.com : modélisation, conseils, audit, optimisation, formation
* * * * * Enseignant CNAM PACA - ISEN Toulon - CESI Aix en Provence * * * * *
SQLpro est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/08/2007, 13h02   #5
Membre expérimenté
 
Inscription : mai 2005
Messages : 414
Détails du profil
Informations forums :
Inscription : mai 2005
Messages : 414
Points : 589
Points : 589
au vue des attentes, du nombre de docs à indexer (millions), je suis d'accord avec SQLpro, je rajouterai même qu'il serait peut être pertinent de réfléchir à des vrais moteurs d'indexation FullText comme RetrievalWare par exemple, qui sont très puissants, performants et permettent beaucoup de choses (recherches thématiques par exemple...)
gregory.broissard est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 08h15.


 
 
 
 
Partenaires

Hébergement Web