IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

Extraction du text sur un PDF


Sujet :

C#

  1. #1
    Membre éclairé
    Inscrit en
    Mars 2006
    Messages
    492
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 492
    Par défaut Extraction du text sur un PDF
    Bonjour,

    Est ce qu'il y a un moyen d'extraire du text sur une zone spécifique (avec coordonnées) ?

    Merci infiniment.

  2. #2
    Modérateur
    Avatar de toopac
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2009
    Messages
    940
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2009
    Messages : 940

  3. #3
    Expert confirmé Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Par défaut
    Dans un pdf, il n'y a pas de notion de texte.

    Une page pdf est composée d'un ensemble de Glyph (caractère, coordonnées en X Y) généralement ordonné en fonction des coordonnées.

    Evidement, pas de caractère "blanc" pour séparer les mots, ni de CRLF pour séparer les lignes .

    A ma connaisssance, les bibli pdf permettent d'accéder aux glyph et/ou d'obtenir tout le texte d'une page ou d'un doc.

    Mais, Une bibli permettant d'extraire le texte d'une zone spécifique risque d'être difficile à trouver.

    Pour l'accès au glyphs, tu peux essayer TallComponents PDFControls 2.0.
    La version d'essai gratuite non limitée dans le temps de son prédecesseur PdfReader.net convenait pour cet objectif.

  4. #4
    Modérateur
    Avatar de toopac
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2009
    Messages
    940
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2009
    Messages : 940
    Par défaut
    oups au temps pour moi, j'avais pas lu le titre... dsl

Discussions similaires

  1. Extraction du texte d'un PDF vers un fichier texte
    Par autran dans le forum Codes sources à télécharger
    Réponses: 2
    Dernier message: 22/07/2015, 19h18
  2. Ajouter du texte sur des graphiques pdf
    Par Fort en pommes dans le forum R
    Réponses: 1
    Dernier message: 20/08/2014, 09h44
  3. Message erreur sur variant [PDF -> TEXT]
    Par bidochon dans le forum API, COM et SDKs
    Réponses: 4
    Dernier message: 04/01/2008, 18h37
  4. Extraction texte sur video
    Par nvincent dans le forum Vidéo
    Réponses: 1
    Dernier message: 07/09/2007, 12h03
  5. [phpToPdf] Texte sur un pdf existant en php
    Par Alain15 dans le forum Bibliothèques et frameworks
    Réponses: 6
    Dernier message: 12/07/2006, 14h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo