IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Lire un pdf et extraire le texte


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Novembre 2004
    Messages
    528
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Chef de projet en SSII

    Informations forums :
    Inscription : Novembre 2004
    Messages : 528
    Par défaut Lire un pdf et extraire le texte
    Bonjour à tous,

    Je débute à l'instant sur python. J'ai deja une question: peut-on lire et extraire le texte (et que le texte) d'un pdf? Si oui comment?
    J'ai lu sur un topic qu'il y a vait 2 alternative, une qui apparement personne n'ait arrivé à installer et une qui a l'air en beta et qu'ils n'ont pas reussi a faire fct non plus.

    Donc je lance un sos à vous tous amis du python.

    MERCI

  2. #2
    Membre Expert Avatar de pacificator
    Profil pro
    Inscrit en
    Août 2006
    Messages
    1 074
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 1 074
    Par défaut
    salut,

    j'ai trouvé ce lien. http://www.boddie.org.uk/david/Proje...thon/pdftools/

    tu as essayé?

  3. #3
    Membre éclairé
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Novembre 2004
    Messages
    528
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Chef de projet en SSII

    Informations forums :
    Inscription : Novembre 2004
    Messages : 528
    Par défaut
    Merci,

    mais celui-ci fait parti des 2 dont j'ai parlé au dessus.

    Voici le lien de la discussion:

    http://www.developpez.net/forums/sho...&highlight=pdf

    Donc je cherche quelqu'un qui a deja utilisé l'un des deux (et qui a reussi) ou autre chose.

    D'avance merci

  4. #4
    Membre Expert Avatar de pacificator
    Profil pro
    Inscrit en
    Août 2006
    Messages
    1 074
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 1 074
    Par défaut
    salut,
    je l'ai installé et testé rapidement et ça ma l'air tout bon...

  5. #5
    Membre éclairé
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Novembre 2004
    Messages
    528
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Chef de projet en SSII

    Informations forums :
    Inscription : Novembre 2004
    Messages : 528
    Par défaut
    Et comment faire pour l'installer?

    Je suis sous windows et j'utilise Eclipse

    MERCI

  6. #6
    Membre Expert Avatar de pacificator
    Profil pro
    Inscrit en
    Août 2006
    Messages
    1 074
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 1 074
    Par défaut
    1. telecharge et installe EasyInstall
    2. en invite de commande: easy_install http://www.boddie.org.uk/david/Proje...ls-0.33.tar.gz
    et voila ...

  7. #7
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    146
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 146
    Par défaut Extraire une info d'un fichier pdf
    Bonjour à tous,

    J'utilise l'outil pyPdf de python pour extraire des informations dans le fichier pdf. Cependant je n'arrive pas a savoir comment récupérer celles qui sont en haut de page( à droite).

    j'ai déja essayé ce programme pour relever des infos:

    input1 = PdfFileReader(file("fichier.pdf", "rb"))
    param = input1.getDestination()
    print param

    MERCI

Discussions similaires

  1. Réponses: 7
    Dernier message: 21/11/2013, 16h00
  2. [FPDF] Extraire le texte d'un fichier PDF
    Par brune38 dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 13/10/2009, 10h26
  3. [FPDF] Extraire le texte d'un pdf
    Par SandraG dans le forum Bibliothèques et frameworks
    Réponses: 13
    Dernier message: 08/10/2009, 14h48
  4. Extraire le texte d'un pdf avec PdfBox en C#
    Par nadabb dans le forum C#
    Réponses: 10
    Dernier message: 28/05/2009, 21h00
  5. Extraire du texte d'un PDF avec layout.
    Par zedtux dans le forum VB 6 et antérieur
    Réponses: 3
    Dernier message: 09/04/2008, 15h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo