IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques tierces Python Discussion :

Tabulation sous TEXTRACT 1.6.3


Sujet :

Bibliothèques tierces Python

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Février 2011
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut Tabulation sous TEXTRACT 1.6.3
    Hello world !

    j'ai fait un petit script me permettant d'extraire le contenu d'un .pdf vers un .txt en conservant le nom du .pdf de base, à l'aide de Textract:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    import os, textract
     
    dossier = os.path.dirname(__file__)
     
    for file in os.listdir(dossier):
        if file.endswith(".pdf"):
            text = textract.process(os.path.join(dossier, file), encoding='ISO-8859-15')
            text = text.decode('cp1252')
     
            with open(os.path.abspath(os.path.join(dossier, f"{file}.doc")), "w", encoding='utf-8') as f:
                f.write(text)
    Au début j'ai franchement galéré pour les caractères avec accents et spéciaux, mais je m'en suis sorti !

    Autre problèmatique maintenant, la gestion des tabulations et des tableaux..
    Savez-vous comment conserver dans le .txt la même dispo que dans le .pdf ?


  2. #2
    Membre éprouvé

    Homme Profil pro
    Ingénieur
    Inscrit en
    Août 2010
    Messages
    654
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Août 2010
    Messages : 654
    Points : 1 150
    Points
    1 150
    Par défaut
    Salut,

    La gestion des tableaux devrait se faire via des tabulations. Dans le texte récupéré, comment sont-ils présentés ? Avez-vous un extrait à partager ?

    J

Discussions similaires

  1. Tabulation sous word : efface au lieu décaler
    Par kothlis dans le forum Word
    Réponses: 6
    Dernier message: 12/10/2007, 22h23
  2. PB tabulation sous formulaire
    Par froutloops62 dans le forum IHM
    Réponses: 1
    Dernier message: 21/05/2007, 18h22
  3. Tabulation sous TeXnicCenter
    Par Gébix dans le forum Editeurs / Outils
    Réponses: 5
    Dernier message: 28/08/2006, 22h00
  4. [VBA-E]Utilisation de la tabulation sous excel
    Par philvba dans le forum Macros et VBA Excel
    Réponses: 11
    Dernier message: 07/02/2006, 17h30
  5. tabulation pour sortir d'un sous formulaire
    Par rapace dans le forum Access
    Réponses: 4
    Dernier message: 30/11/2005, 16h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo