Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

+ Répondre à la discussion

Discussion :

Tabulation sous TEXTRACT 1.6.3

Sujet :

Bibliothèques tierces Python

Outils de la discussion
- Afficher une version imprimable
- S'abonner à cette discussion…
Affichage
- Choisir le mode linéaire
- Choisir le mode hybride
- Mode arborescent

Mode arborescent

Message précédent

Message suivant

06/09/2020, 23h27 #1

KGN06

Membre du Club

Tabulation sous TEXTRACT 1.6.3

Hello world !

j'ai fait un petit script me permettant d'extraire le contenu d'un .pdf vers un .txt en conservant le nom du .pdf de base, à l'aide de Textract:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
import os, textract
 
dossier = os.path.dirname(__file__)
 
for file in os.listdir(dossier):
    if file.endswith(".pdf"):
        text = textract.process(os.path.join(dossier, file), encoding='ISO-8859-15')
        text = text.decode('cp1252')
 
        with open(os.path.abspath(os.path.join(dossier, f"{file}.doc")), "w", encoding='utf-8') as f:
            f.write(text)

Au début j'ai franchement galéré pour les caractères avec accents et spéciaux, mais je m'en suis sorti !

Autre problèmatique maintenant, la gestion des tabulations et des tableaux..
Savez-vous comment conserver dans le .txt la même dispo que dans le .pdf ?

Répondre avec citation 0 0

+ Répondre à la discussion

« Discussion précédente | Discussion suivante »

Discussions similaires

Tabulation sous word : efface au lieu décaler
Par kothlis dans le forum Word

Réponses: 6
Dernier message: 12/10/2007, 23h23
PB tabulation sous formulaire
Par froutloops62 dans le forum IHM

Réponses: 1
Dernier message: 21/05/2007, 19h22
Tabulation sous TeXnicCenter
Par Gébix dans le forum Editeurs / Outils

Réponses: 5
Dernier message: 28/08/2006, 23h00
[VBA-E]Utilisation de la tabulation sous excel
Par philvba dans le forum Macros et VBA Excel

Réponses: 11
Dernier message: 07/02/2006, 18h30
tabulation pour sortir d'un sous formulaire
Par rapace dans le forum Access

Réponses: 4
Dernier message: 30/11/2005, 17h20

Tabulation sous TEXTRACT 1.6.3

Bibliothèques tierces Python

Mode arborescent

Discussions similaires

Partager

Partager