IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB.NET Discussion :

[vb] morceaux d'un pdf vers txt


Sujet :

VB.NET

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    365
    Détails du profil
    Informations personnelles :
    Âge : 37
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 365
    Points : 176
    Points
    176
    Par défaut [vb] morceaux d'un pdf vers txt
    Bonjour,
    je cherche à transformer en texte une zone d'un fichier pdf. Pour transformer le fichier pdf en texte j'utilise FREngine qui est un outils d'OCR développé par la société ABBYY. Je souhaite ne convertir qu'une zone, définie par des coordonnées que l'on fournira au programme.
    je programme en vb9 et je souhaiterais savoir si on peut ne transformer qu'une zone de mon document ou si il faut créer un autre document ne contenant que la partie à transformer et la transformer par la suite, et par la suite comment faire.

    Merci
    Qui vit par le Troll périra par le Troll!

  2. #2
    Expert éminent Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Points : 7 903
    Points
    7 903
    Par défaut
    Sachant qu'en pdf, il n'y a pas de notion de texte : seulement des caractères isolés (Glyph) et pas de caractère "blanc", on devra en l'absence d'une bibli ad-hoc (j'en connais pas) :
    1. utiliser une bibliothèque qui permet de connaitre tous les glyph d'un document avec n° de page et position en x,y dans la page,
    2. créer sa fonction qui à partir de ces informations reconstitue les lignes en insérant les "blancs" en fonction de la disposition des glyph.

    La bibliothèque PDFControls 2.0 de TallComponents (même en version évaluation) devrait permettre de répondre au 1), si les classes ont une compatibilité ascendante avec celles de son prédecesseur PDFReader.
    Voir : http://www.tallcomponents.com/pdfcontrols2.aspx
    " Le croquemitaine ! Aaaaaah ! Où ça ? " ©Homer Simpson

Discussions similaires

  1. Extraire PDF vers excell, txt, etc.
    Par aristeas dans le forum API standards et tierces
    Réponses: 4
    Dernier message: 14/07/2008, 22h14
  2. [XSLT] Conversion xml vers txt ou mdb etc
    Par narodar dans le forum XSL/XSLT/XPATH
    Réponses: 1
    Dernier message: 23/06/2006, 14h31
  3. Exporter PDF vers XLS
    Par Jaggana dans le forum C
    Réponses: 7
    Dernier message: 11/04/2006, 16h23
  4. [VBA-E] .XLS vers .TXT (enregistrement fixe)
    Par turbo74 dans le forum Macros et VBA Excel
    Réponses: 11
    Dernier message: 17/03/2006, 15h45
  5. [INTERBASE] Extraction vers txt d'un blob
    Par FORESTIER dans le forum InterBase
    Réponses: 6
    Dernier message: 09/11/2004, 14h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo