|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Inscription : août 2005 Messages : 4 ![]() |
Bonjour à tous,
J'aimerais créer un moteur de recherche intra-PDF, c'est à dire faire du pattern matching mais dans une "bibliothèque" de PDF .... Existe t-il un outil ou des méthode pour rechercher des mots clés dans les PDF's ? Merci d'avance pour vos réponses |
|
|
00
|
|
|
#2 |
|
Membre expérimenté
![]() Développeur Web Inscription : avril 2006 Messages : 430 ![]() |
Salut,
à titre d'info, pour indexer les PDF, les moteurs de recherche style mnogosearch utilisent un outil de conversion PDF -> text (pour autant que les PDF ne soient pas protégés). A l'heure actuelle, c'est la meilleure solution que je connaisse, perso. |
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : août 2005 Messages : 4 ![]() |
Merci de la réponse, c'est bon à savoir.
Mais dans mon cas j'aurais besoin de qq chose de plus petit, c'est pour un petit site. Faire la fontcion de pattern matching ne me dérange pas mais je cherche en vain des infos qui pourraient me servir , ou un petit exemple ..... |
|
|
00
|
|
|
#4 |
|
Membre expérimenté
![]() Développeur Web Inscription : avril 2006 Messages : 430 ![]() |
ben c'est pas très gros comme solution
si t'es sous linux, y'a pas mal d'utilitaires pour faire la conversion à la volée de pdf vers du texte classique. Ensuite tu fais un petit parsing du resultat, et voila |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com