IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

ASP.NET Discussion :

Aide pour la concéption d'un moteur de recherche


Sujet :

ASP.NET

  1. #1
    Membre averti
    Inscrit en
    Janvier 2008
    Messages
    19
    Détails du profil
    Informations forums :
    Inscription : Janvier 2008
    Messages : 19
    Par défaut Aide pour la concéption d'un moteur de recherche
    Salut tout le monde,
    Je suis dans un stage, et ils m'ont demandé de faire la concéption d'un moteur de recherche, le moteur de recherche consiste à faire la recherche dans des ressources (PDFs) que ça soit sur format image ou format PDF normal.
    J'ai choisi comme plateforme .NET.
    ==> asp.NET / c#
    et comme base de donnée SGBDR oracle 10.
    Je ne sais pas qu'est ce que je dois suivre comme chemin car je n'ai jamais fais un moteur de recherche et je ne sais pas qu'est ce que je dois faire.

  2. #2
    Rédacteur
    Avatar de Louis-Guillaume Morand
    Homme Profil pro
    Cloud Architect
    Inscrit en
    Mars 2003
    Messages
    10 839
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Cloud Architect
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2003
    Messages : 10 839
    Par défaut
    ca dépend de plein de choses.
    où seront stockées les fichiers. sur quoi seront basées les recherches? utiliseras-tu des meta données, lire le contenu des fichiers ou simplement des champs de description à saisir lors de l'enregistrement de chaque fichier?
    as-tu fais une liste exhaustive des types de fichiers à gérer? as-tu déjà la liste de tous les critères de recherche disponibles?

    avant de penser technique, pense besoin. quelqu'un dans ta boite DOIT te fournir une expression des besoins, et ensuite, vous devez définir des spécifications fonctionnelles. Après, tu verras pour ce qui est technique. Avoir choisi telle ou telle techno avant d'avoir défini le reste est une très mauvaise habitude.

    Par exemple, si jamais tu utilisais des metadonnées XML alors un SQL serveur utilisant la recherche "full-text" optimisée pour XML serait la meilleure solution technique.

  3. #3
    Membre Expert Avatar de Arthis
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    1 265
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : Italie

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 265
    Par défaut
    cherche searcharoo sur google c'est un moteur de recherche de pages web open source developpé en dot net. bien pratique après je ne me rappelle plus de ses limites ( si il va aussi dans les pdf par exemple..)

    bon courage à toi en tout cas,

  4. #4
    Membre Expert
    Homme Profil pro
    Inscrit en
    Juillet 2007
    Messages
    1 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Réunion

    Informations forums :
    Inscription : Juillet 2007
    Messages : 1 277
    Par défaut
    Windows Desktop Search
    Lucene.NET

    Concernant les PDF images, il va falloir passer un OCR sinon...

  5. #5
    Membre averti
    Inscrit en
    Janvier 2008
    Messages
    19
    Détails du profil
    Informations forums :
    Inscription : Janvier 2008
    Messages : 19
    Par défaut
    Louis-Guillaume Morand : Je n'est qu'un seul type de document se sont des PDFs stockés dans des répertoires.
    Exp: Les PDFs chiffrés de 1..10 dans un répertoire de 11..20 dans un autre ansi de suite.

  6. #6
    Membre éclairé
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    60
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2009
    Messages : 60
    Par défaut
    Salut,
    Concernant la lecture des Contenus des Pdfs, un conseil utilise PdfBox(Apache), j'ai pas mal cherché à ce niveau là et il reste le plus facile à exploiter (itextsharp ne sait pas lire correctement du contenu pdf)

    De plus, si tu peux utiliser un systeme de moteur de recherche existant, Lucene.NET comme Kaidan te l'a conseillé est pas mal, de plus pdfbox et Lucene peuvent s'interfacer ensemble.

    Après ça dépend de tes besoins précis

Discussions similaires

  1. Réponses: 3
    Dernier message: 12/07/2012, 23h15
  2. [MySQL] Les solutions pour mettre en place un moteur de recherche
    Par nesswaw dans le forum PHP & Base de données
    Réponses: 18
    Dernier message: 09/09/2011, 16h09
  3. Réponses: 5
    Dernier message: 10/07/2006, 09h42

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo