Bonjour,
je sais que ce sujet a déjà été abordé dans le forum, mais pas dans des sujets postérieurs à 2010, d'après mes recherches...
Donc mon problème est simple : prendre un fichier .pdf, et en extraire le contenu, comme s'il s'agissait d'un texte, avec open() et readlines(), pour retenir le contenu sous forme de chaines de caractères.
J'ai essayé plusieurs modules (PDFMiner, pyPdf, etc...), mais je galère pour seulement les installer.
Connaissez-vous un module récent, simple d'installation, et qui permet cette fonctionnalité ?
Je vous remercie d'avance.
Partager