IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Module de traitement de fichier pdf


Sujet :

Python

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Avril 2021
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Burkina Faso

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Avril 2021
    Messages : 4
    Par défaut Module de traitement de fichier pdf
    Bonsoir comment allez vous ? Je suis en phase de creation d'une une application qui manipule les donnees d'un fichier pdf , est ce que vous pouvez m'aider des noms de modules qui me permettrait de traiter les donnees du fichier automatiquement ?

  2. #2
    Expert confirmé
    Avatar de tyrtamos
    Homme Profil pro
    Retraité
    Inscrit en
    Décembre 2007
    Messages
    4 486
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2007
    Messages : 4 486
    Billets dans le blog
    6
    Par défaut
    Bonjour

    Voir ici par exemple: https://towardsdatascience.com/pdf-t...on-5b6ab9e92dd

    J'ai déjà utilisé PyPDF2 pour découper ou regrouper des pages pdf, mais on peut aussi faire des extractions de texte:

    https://pypi.org/project/PyPDF2/

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Avril 2021
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Burkina Faso

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Avril 2021
    Messages : 4
    Par défaut extraction d'un tableau avec Camelot de python
    Merci tyrtamos mais j'avais oublier de mentionner que cest pour extraire un tableau d'un fichier pdf . Je suis arriver a avoir un module qui est "CAMELOT" mais la aussi xa me donne des erreurs

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     import camelot
    >>> tables = camelot.read_pdf('sem.pdf')
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\io.py", line 113, in read_pdf
        tables = p.parse(
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 165, in parse
        self._save_page(self.filepath, p, tempdir)
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 105, in _save_page
        with open(filepath, "rb") as fileobj:
    FileNotFoundError: [Errno 2] No such file or directory: 'sem.pdf'

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 695
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 695
    Par défaut
    Salut,

    L'erreur dit juste que çà ne trouve pas le fichier dans le répertoire courant.

    Ce qui devrait vous conduire à réviser/apprendre ces notions qui sont normalement abordées dans tous les tutos. (dans le Swinnen c'est ici).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Avril 2021
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Burkina Faso

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Avril 2021
    Messages : 4
    Par défaut desoler javais pas remarquer avant de coller . Voici la vrai erreur concernant "CAMELOT de python"
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    Traceback (most recent call last):
      File "C:\Users\SBothe\Desktop\python\emploiPY.py", line 29, in <module>
        tables = camelot.read_pdf('sem.pdf')
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\io.py", line 113, in read_pdf
        tables = p.parse(
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 171, in parse
        t = parser.extract_tables(
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\parsers\lattice.py", line 402, in extract_tables
        self._generate_image()
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\parsers\lattice.py", line 211, in _generate_image
        from ..ext.ghostscript import Ghostscript
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\ext\ghostscript\__init__.py", line 24, in <module>
        from . import _gsprint as gs
      File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\ext\ghostscript\_gsprint.py", line 256, in <module>
        raise RuntimeError("Please make sure that Ghostscript is installed")
    RuntimeError: Please make sure that Ghostscript is installed

  6. #6
    Futur Membre du Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Avril 2021
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Burkina Faso

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Avril 2021
    Messages : 4
    Par défaut
    Je crois avoir installer "Ghostscript" mais le probleme persite . Je sollicite votre aide

Discussions similaires

  1. Traitement par lot fichiers PDF
    Par Triton972 dans le forum Imagerie
    Réponses: 1
    Dernier message: 10/01/2012, 15h18
  2. Réponses: 0
    Dernier message: 17/05/2010, 16h17
  3. [A-07] traitement de fichier par lot vers pdf
    Par moulinmax dans le forum VBA Access
    Réponses: 2
    Dernier message: 15/12/2008, 20h55
  4. Cherche MODULE pour concaténer des fichiers PDF
    Par DevPerl dans le forum Modules
    Réponses: 1
    Dernier message: 21/10/2007, 17h11
  5. [PDF]Module extraction données de fichiers PDF
    Par boniface dans le forum Modules
    Réponses: 4
    Dernier message: 10/04/2007, 11h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo