IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement SQL Server Discussion :

Recherche textuelle sur des fichiers donnés par une URL


Sujet :

Développement SQL Server

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut Recherche textuelle sur des fichiers donnés par une URL
    Une question de faisabilité : j'imagine une bdd qui fournirait une liste d'URLs.
    http://URL1
    http://URL2
    http://URL3
    etc.
    Ma question est : quels sont les documents qui contiennent le texte "toto". Donc est-il possible d'écrire une requête SQL qui permettrait d'explorer tous les fichiers pointés par les URLs à le recherche de la chaîne de caractères "toto" ?
    La réponse serait donc du genre : la chaîne de caractères "toto" est contenue dans les fichiers dont l'URL est http://URL1, http://URL3, etc.

  2. #2
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut
    Mon problème est le suivant : je dispose d'environ 10000 fichiers (pdf ou txt) qui vont être stockés sur un serveur et seront accessibles par une URL. Je souhaite effectuer une recherche sur ces fichiers. La méthode bourrin consisterait à les ouvrir un par un et à chaque fois faire la recherche sauf qu'une telle méthode risque de faire qu'une recherche dure plusieurs jours. C'est pourquoi je cherche une autre méthode et donc me pose la question de la faisabilité de faire cette recherche en SQL. Si jamais vous avez une solution (qui passe par SQL ou autre) je suis preneur.

  3. #3
    Rédacteur/Modérateur

    Avatar de SergioMaster
    Homme Profil pro
    Développeur informatique retraité
    Inscrit en
    Janvier 2007
    Messages
    15 598
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 69
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2007
    Messages : 15 598
    Billets dans le blog
    65
    Par défaut
    Bonjour,

    question sans fondement, si les données (c.a.d. les octets des fichiers) ne sont pas dans la base comment voulez vous faire une requête dessus !
    AMHA il faut se tourner vers une base documentaire de type NoSQL

  4. #4
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut
    Merci quand même de la confirmation d'un expert ; je croyais au père Noël...

  5. #5
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 999
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 999
    Billets dans le blog
    6
    Par défaut
    Citation Envoyé par laurentSc Voir le message
    Merci quand même de la confirmation d'un expert ; je croyais au père Noël...
    Contrairement à ce qui vous a été dit, il est parfaitement possible d'utiliser un SGBDR pour indexer des documents électronique de toute nature.

    par exemple avec SQL Server et même en version Express gratuite, vous pouvez indexer des documents électronique, même s'il ne sont pas stockés dans la base.
    Il faut définir dans votre base une FILETABLE qui représente le point d'entrée de votre arborescence de fichier html, puis définir un index textuel dessus en informant de la nature du doc (via son extension)
    Il ne vous restera plus ensuite qu'à faire des requêtes avec CONTAINS par exemple.

    A lire sur le sujet :
    https://www.simple-talk.com/sql/data...in-filetables/
    http://blog.developpez.com/sqlpro/p9...text_search_no

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  6. #6
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut
    Merci pour la piste ; je regarde dans l'après-midi...

  7. #7
    Rédacteur/Modérateur

    Avatar de SergioMaster
    Homme Profil pro
    Développeur informatique retraité
    Inscrit en
    Janvier 2007
    Messages
    15 598
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 69
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2007
    Messages : 15 598
    Billets dans le blog
    65
    Par défaut
    Bonjour,
    Citation Envoyé par laurentSc Voir le message
    Merci quand même de la confirmation d'un expert ; je croyais au père Noël...
    je n'ai jamais dit que j'étais un expert dans le domaine SGBD, je n'en connais que certaines

    Citation Envoyé par SQLPro
    Vous feriez mieux de pas donner des conseils aussi stupide !
    ça fait 17 ans que SQL Server index textuellement des documents électroniques et 12 ans qu'il peut le faire en déporté (stockage FILESTREAM puis FILETABLE)
    Alors au lieu de renvoyer pas méconnaissance des gens vers des outils complexe, vous feriez mieux de vous tenir au courant !
    toujours aussi abrupt et peu diplomate. le A.M.H.A. était pourtant là pour dire que ce n'était que mon avis personnel.

    quant à la complexité d'une base NOSQL pour moi elle est la même que SQL Server (qui est loin d'être mon SGBD de prédilection)

    Quant à me tenir au courant, il y a trop de SGBD et si j'en crois le lien qui est indiqué cela ne fait pas 12 ans mais 4 que
    Citation Envoyé par Feodor Georgiev
    SQL 2012 came FileTable technology
    bref désormais, je fermerai ma grande mais humble g.... sur cette partie du forum

  8. #8
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 999
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 999
    Billets dans le blog
    6
    Par défaut
    Citation Envoyé par SergioMaster Voir le message
    Bonjour,

    je n'ai jamais dit que j'étais un expert dans le domaine SGBD, je n'en connais que certaines


    toujours aussi abrupt et peu diplomate. le A.M.H.A. était pourtant là pour dire que ce n'était que mon avis personnel.
    Hé oui, je ne suis pas adepte du consensus mou ni du politiquement correct, au contraire de certains comme François Hollande !

    quant à la complexité d'une base NOSQL pour moi elle est la même que SQL Server (qui est loin d'être mon SGBD de prédilection)
    Pour la complexité je veut bien... Pour le SGBD c'est dommage que tu ne t'y intéresse pas et cela pour plusieurs raisons... C'est l'u des moins complexes, le plus utilisé aujourd'hui en entreprise et bientôt sur Linux (une version Beta est déjà dispo...)

    Quant à me tenir au courant, il y a trop de SGBD et si j'en crois le lien qui est indiqué cela ne fait pas 12 ans mais 4
    Grosso modo il n'y a que 4 SGBDR qui ont 90% des parts de marché : Oracle, SQL Server, MySQL et PostGreSQL
    Et cela fait bien 17 ans que SQL Server sait indexer des documents électronique de toutes natures... (version SQL Server 7 de 1999)
    Depuis 2008 en les stockant en sus dans du FILESTREAM et depuis 2012 dans du FILETABLE


    bref désormais, je fermerai ma grande mais humble g.... sur cette partie du forum
    Non, non, t'inquiète.... Parfois je veille !!!

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  9. #9
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 999
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 999
    Billets dans le blog
    6
    Par défaut
    Citation Envoyé par SergioMaster Voir le message
    Bonjour,

    question sans fondement, si les données (c.a.d. les octets des fichiers) ne sont pas dans la base comment voulez vous faire une requête dessus !
    AMHA il faut se tourner vers une base documentaire de type NoSQL
    Vous feriez mieux de pas donner des conseils aussi stupide !

    ça fait 17 ans que SQL Server index textuellement des documents électroniques et 12 ans qu'il peut le faire en déporté (stockage FILESTREAM puis FILETABLE)

    Alors au lieu de renvoyer pas méconnaissance des gens vers des outils complexe, vous feriez mieux de vous tenir au courant !

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Débutant] Comande Shell: path fichier donné par une variable?
    Par Be0rn dans le forum VB.NET
    Réponses: 7
    Dernier message: 16/09/2011, 13h45
  2. gestion des fichiers crées par une base de donnée installée sur linux
    Par jo-concept dans le forum Administration système
    Réponses: 2
    Dernier message: 29/03/2011, 20h01
  3. Réponses: 4
    Dernier message: 23/02/2011, 11h11
  4. Réponses: 2
    Dernier message: 07/06/2010, 14h19
  5. Lire des fichiers à envoyer par une servlet
    Par loic911 dans le forum Langage
    Réponses: 1
    Dernier message: 30/04/2007, 16h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo