IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

Base de donnée PDF


Sujet :

Décisions SGBD

  1. #1
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2019
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2019
    Messages : 5
    Points : 2
    Points
    2
    Par défaut Base de donnée PDF
    Bonjour à tous,

    C'est mon premier message et je vous sollicite pour une création de DB PDF.

    J'ai commencé récemment la programmation (SQL + python + html,css) et je souhaite dans le cadre professionnel créer une base de données avec des fichiers PDF.

    En faite je travaille pour une société de consulting et j'ai de multiples CV à disposition et pour retrouver un CV avec des keywords "développeur + SQL + oracle etc" j'aimerais créer ma propre base de données et ensuite y faire des requêtes afin de voir afficher le/les CV qui correspondront aux keywords.

    J'ai un peu cherché sur le net mais je ne trouve rien. Est ce que quelqu'un pourrait me mettre sur une piste ?

    Merci d'avance,

  2. #2
    Expert éminent
    Avatar de StringBuilder
    Homme Profil pro
    Chef de projets
    Inscrit en
    Février 2010
    Messages
    4 149
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Chef de projets
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2010
    Messages : 4 149
    Points : 7 392
    Points
    7 392
    Billets dans le blog
    1
    Par défaut
    Y'a probablement mieux, mais vous pouvez utiliser SQL Server pour ça.
    Il suffit de stocker les fichiers dans une colonne de type varbinary(max) et créer un index littéral dessus.

    L'intérêt, c'est que SQL Server dispose d'un IFilter permettant d'indexer le contenu des PDF. Ainsi, vous pourrez rechercher dans le contenu des PDF depuis vos requêtes SQL.

    Autre solution : passer par le moteur d'indexation Windows Search (anciennement Index Server) : pas besoin de base de données, vous pouvez interroger directement l'index à partir du système de fichiers pour retrouver les PDF sans passer par une base de données.

    Exemple avec Windows Search SANS base de données :
    Code csharp : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
     
    using System;
    using System.Data.OleDb;
     
    namespace TestSearch
    {
        class Program
        {
            static void Main(string[] args)
            {
                string connectionString = "Provider=Search.CollatorDSO;Extended Properties=\"Application=Windows\"";
                OleDbConnection connection = new OleDbConnection(connectionString);
     
                string query = @"SELECT System.ItemName FROM SystemIndex " +
                @"WHERE scope ='file:" + System.Environment.GetFolderPath(Environment.SpecialFolder.Desktop) + "' and System.FileExtension = '.pdf' and  and (FREETEXT('dauphin') or FREETEXT('baignoire'))";
                //@"WHERE scope ='file:C:\in\Test\' and FREETEXT('démon')";
                OleDbCommand command = new OleDbCommand(query, connection);
                connection.Open();
     
                OleDbDataReader reader = command.ExecuteReader();
                while (reader.Read())
                {
                    Console.WriteLine(reader.GetString(0));
                }
     
                connection.Close();
     
                Console.WriteLine("Terminé");
                Console.ReadKey(true);
            }
        }
    }

    Ce code recherche dans un dossier "Livres" sur le bureau tous les fichiers PDF contenant quelque part le mot "dauphin" ou "baignoire".

    Je colle quelques romans d'environ 200 pages chacuns sur mon bureau.

    Je lance moins de 30 secondes après (l'indexation est extrêmement véloce) ;
    Adams,Douglas-[H2G2-1]Le Guide du Routard Galactique(1979).OCR.French.ebook.AlexandriZ.pdf
    Adams,Douglas-[H2G2-2]Le Dernier Restaurant avant la Fin du Monde(1980).pdf
    Adams,Douglas-[H2G2-4]Salut, et encore merci pour le poisson(1984).pdf
    Colfer,Eoin-[H2G2-6]Encore une chose...(2009).OCR.French.ebook.AlexandriZ.pdf
    Terminé
    Et on découvre les yeux stupéfaits que seuls les tomes 3 et 5 de la saga "Le Guide du Routard Galactique" ne parlent ni de dauphin ni de baleine...
    On ne jouit bien que de ce qu’on partage.

  3. #3
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 761
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 761
    Points : 52 547
    Points
    52 547
    Billets dans le blog
    5
    Par défaut
    En fait c'est le même moteur d'indexation qui est utilisé à la fois par Windows et SQL Server, mais à la différence qu'il est intégré dans SQL Server en sus de Windows….

    Pour info si les PDF dépassent les 2 Mo en général, alors mieux vaut les stocker en FILESTREAM... Avantage avec une base express (gratuite) la volumétrie des fichiers PDF n'est pas pris en compte dans la limite des 10 Go par base !

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  4. #4
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2019
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2019
    Messages : 5
    Points : 2
    Points
    2
    Par défaut
    Bonjour,

    Merci pour vos informations, stringbuilder et sqlpro, je vais essayer ca sur SQL server dès demain. Ayant appris depuis peu à faire des requêtes dans une DB je prèfere pour l'instant essayer avec ce que j'ai appris.

    A+

Discussions similaires

  1. [XL-2007] Base de données pdf
    Par doubiste_59 dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 13/07/2010, 15h55
  2. Afficher un PDF issu d'une base de données
    Par bannik dans le forum Langage
    Réponses: 1
    Dernier message: 06/02/2008, 15h12
  3. Réponses: 1
    Dernier message: 22/11/2007, 08h42
  4. [MySQL] pdf en base de données
    Par kiranis dans le forum PHP & Base de données
    Réponses: 1
    Dernier message: 02/08/2007, 11h55
  5. Jtable pb ouverture d'un pdf dans une base de donnée
    Par fredo1314 dans le forum Composants
    Réponses: 11
    Dernier message: 11/07/2006, 19h15

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo