bonjour je voulais savoir si possible de taper un mot n'importe le quelle dans une base et ma base recherche dans les fichiers .pdf ou .doc et mot sort tous lien des pdf ou doc correspond a ma recherche.
y a il un programme qui fais sa ??
bonjour je voulais savoir si possible de taper un mot n'importe le quelle dans une base et ma base recherche dans les fichiers .pdf ou .doc et mot sort tous lien des pdf ou doc correspond a ma recherche.
y a il un programme qui fais sa ??
Bonjour,
Il y a bien entendu les fonctions de recherche et d'indexation de contenu de SharePoint qui sont déjà très puissantes, et pour aller plus loin encore : Fast Search. Mais je doute que tu ais envie de débourser plus 20.000 euros de licence ?
Après, tu peux regarder du côté de la fonction Full-Text Search de SQL Server par exemple. Mais je n'ai jamais mis ça en place et ne saurais te dire ce qu'il en est des pdf par exemple...
Surtout, ta question n'est pas dans le bon forum donc tu auras plus de mal d'obtenir la réponse de quelqu'un maîtrisant ce sujet. Demande à un modo de le déplacer.
En espérant t'avoir aidé.
Dans un pdf, il n'y a pas de notion de texte.Mais je n'ai jamais mis ça en place et ne saurais te dire ce qu'il en est des pdf par exemple...
Une page pdf est composée d'un ensemble de Glyph (caractère, coordonnées en X Y) généralement ordonné en fonction des coordonnées.
Evidement, pas de caractère "blanc" pour séparer les mots, ni de CRLF pour séparer les lignes.
A ma connaisssance, les bibli pdf permettent d'accéder aux glyph et/ou d'obtenir tout le texte d'une page ou d'un doc.
Mais, Une bibli permettant d'extraire le texte d'une zone spécifique risque d'être difficile à trouver.
Pour l'accès au glyphs, tu peux essayer TallComponents PDFControls 2.0.
La version d'essai gratuite non limitée dans le temps de son prédecesseur PdfReader.net convenait pour cet objectif.
Si tu veux tout simplement récupérer le texte brut de l'ensemble du document (ou peut-être d'une page), il y a beaucoup plus de possibilités pour trouver une bibli (ou un convertisseur en .txt).
Partager