Bonsoir comment allez vous ? Je suis en phase de creation d'une une application qui manipule les donnees d'un fichier pdf , est ce que vous pouvez m'aider des noms de modules qui me permettrait de traiter les donnees du fichier automatiquement ?
Bonsoir comment allez vous ? Je suis en phase de creation d'une une application qui manipule les donnees d'un fichier pdf , est ce que vous pouvez m'aider des noms de modules qui me permettrait de traiter les donnees du fichier automatiquement ?
Bonjour
Voir ici par exemple: https://towardsdatascience.com/pdf-t...on-5b6ab9e92dd
J'ai déjà utilisé PyPDF2 pour découper ou regrouper des pages pdf, mais on peut aussi faire des extractions de texte:
https://pypi.org/project/PyPDF2/
Merci tyrtamos mais j'avais oublier de mentionner que cest pour extraire un tableau d'un fichier pdf . Je suis arriver a avoir un module qui est "CAMELOT" mais la aussi xa me donne des erreurs
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 import camelot >>> tables = camelot.read_pdf('sem.pdf') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\io.py", line 113, in read_pdf tables = p.parse( File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 165, in parse self._save_page(self.filepath, p, tempdir) File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 105, in _save_page with open(filepath, "rb") as fileobj: FileNotFoundError: [Errno 2] No such file or directory: 'sem.pdf'
Salut,
L'erreur dit juste que çà ne trouve pas le fichier dans le répertoire courant.
Ce qui devrait vous conduire à réviser/apprendre ces notions qui sont normalement abordées dans tous les tutos. (dans le Swinnen c'est ici).
- W
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 Traceback (most recent call last): File "C:\Users\SBothe\Desktop\python\emploiPY.py", line 29, in <module> tables = camelot.read_pdf('sem.pdf') File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\io.py", line 113, in read_pdf tables = p.parse( File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\handlers.py", line 171, in parse t = parser.extract_tables( File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\parsers\lattice.py", line 402, in extract_tables self._generate_image() File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\parsers\lattice.py", line 211, in _generate_image from ..ext.ghostscript import Ghostscript File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\ext\ghostscript\__init__.py", line 24, in <module> from . import _gsprint as gs File "C:\Users\SBothe\AppData\Local\Programs\Python\Python39\lib\site-packages\camelot\ext\ghostscript\_gsprint.py", line 256, in <module> raise RuntimeError("Please make sure that Ghostscript is installed") RuntimeError: Please make sure that Ghostscript is installed
Je crois avoir installer "Ghostscript" mais le probleme persite . Je sollicite votre aide
Partager