IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Convertir un PDF en TXT


Sujet :

Langage Perl

  1. #1
    Membre habitué Avatar de PadawanInPerl
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    462
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2009
    Messages : 462
    Points : 186
    Points
    186
    Par défaut Convertir un PDF en TXT
    Bonjour,

    Est-il possible de convertir un pdf en texte ?

    Je pense qu'il faut utiliser ça :
    mais j'ai pas réussi à exploiter les infos...

    QQ peut-il m'aider ?
    Windows 7, 64 bit
    Perl 5.12, ActivePerl
    Python 3.2, ActivePython ( NOVICE ! )

  2. #2
    Membre habitué Avatar de PadawanInPerl
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    462
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2009
    Messages : 462
    Points : 186
    Points
    186
    Par défaut
    sur le net on propose : File::Extract:DF

    Mais il n'est pas sur le PPM
    Windows 7, 64 bit
    Perl 5.12, ActivePerl
    Python 3.2, ActivePython ( NOVICE ! )

  3. #3
    Membre habitué Avatar de PadawanInPerl
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    462
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2009
    Messages : 462
    Points : 186
    Points
    186
    Par défaut
    Poiur info...

    j'ai réussi à faire avec :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    use CAM::PDF;
    use CAM::PDF::PageText;
    Windows 7, 64 bit
    Perl 5.12, ActivePerl
    Python 3.2, ActivePython ( NOVICE ! )

  4. #4
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 256
    Points
    12 256
    Billets dans le blog
    1
    Par défaut
    Bonjour,

    il semble paradoxalement plus facile de créer un document PDF (simple) que d'en lire un, tant les formats à l'intérieur d'un document PDF peuvent varier (inclusion de polices, d'images, d'images rasterisées, etc.).

    Le module PDF::API2 (en particulier PDF::API2::File) permet en principe de le faire, mais la lecture de la documentation suffit à donner la migraine. En tous cas, je n'ai jamais essayé et ne peux pas t'aider sur ce point.

    Je ne réponds donc que pour te proposer une éventuelle solution de contournement qui consisterait à utiliser Perltohtml (http://pdftohtml.sourceforge.net/), qui peut transformer un document PDF en HTML ou en XML, puis à se débrouiller d'une façon ou d'une autre pour virer les balises et tout ce qui gêne.

  5. #5
    Membre habitué Avatar de PadawanInPerl
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    462
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2009
    Messages : 462
    Points : 186
    Points
    186
    Par défaut
    MErci pour ta réponse !
    Windows 7, 64 bit
    Perl 5.12, ActivePerl
    Python 3.2, ActivePython ( NOVICE ! )

Discussions similaires

  1. convertir un fichier pdf a txt
    Par cam_fm dans le forum VB.NET
    Réponses: 4
    Dernier message: 15/09/2010, 13h32
  2. Convertir HTML > PDF
    Par mauvais_karma dans le forum Documents
    Réponses: 6
    Dernier message: 26/02/2007, 12h29
  3. [MFC] convertir un fichier Pdf to txt
    Par mqsi dans le forum MFC
    Réponses: 2
    Dernier message: 19/01/2007, 11h14
  4. [PDF] comment convertir un PDF en fichier images
    Par magnus2005 dans le forum API standards et tierces
    Réponses: 1
    Dernier message: 23/05/2006, 19h04
  5. Convertir un *.pdf en un format plus leger
    Par Nasky dans le forum Autres Logiciels
    Réponses: 8
    Dernier message: 23/06/2003, 08h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo