Bonjour à tous
Je cherche un moyen pour convertir tout type de fichier en Image TIF
Si vous avez des idées ?
Merci
Bonjour à tous
Je cherche un moyen pour convertir tout type de fichier en Image TIF
Si vous avez des idées ?
Merci
Bonjour et merci de me répondre
je souhaiterais convertir des documents pdf, word ou autre en fichier tiff. Pour l'instant j'utilise des apis distinctes pour un type de fichier données comme ghostscript pour pdf, etc et j'aimerais simplifier la demarche en regroupant cette conversion en un seul module. Un peu comme une imprimante virtuelle genre pdfCreator
Merci
Sous linux,créez une imprimante postscript dans cups associée à un script, script qui fera du PS2TIFF. Quel est le but recherché, envoyer ça vers un logiciel de fax?
J'aimerais quelque chose de portable sur differents OS.
Le but est de créer une chaine d'automatisation pour pouvoir indexer des fichiers. D'abord on convertit en tiff, puis reconnaissance de caractère, extraction des données et alimentation d'une base de données.
ca n'a pas de sens. Si t'as des documents en PDF, PS, DOC, ODT, etc, de les convertir en image puis de passer un OCR qui ne sera pas parfait dessus. Indexe directement le contenu des documents. Il existe de nombreuses librairies pour extraire le contenu de ces documents, sans la mise en forme.
De plus des outils d'indexation comme lucene fournissent un système d'extension qui permet de lui ajouter des filtre "document type XYZ -> texte brut" afin de les indexer.
Donc si j'ai bien compris il vaut mieux que j'utilise differentes API pour tranformer mes documents en texte brut c'est à dire avec les metadonnées et lucène me permettrait de récupérer que le texte nécessaire à mon indexation don sans les meta
non lucène est un indexeur. Par défaut il viens avec un série de parseurs pour différents format, tu devra ajouter les tiens pour les autres formats non supporté en standard. Normalement pas besoin de prétraitement pour lucene donc puisque c'est le parseur qui se charge d'extraire le texte et les metadonnées.
Genial c'est exactement ce qu'il me faut.
J'ai regardé la doc sur apparemment il supporte tous les fichiers pouvant être convertit en texte
Donc je vais le tester
Merci pour tes éclaircissements
Ciao
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager