Bonjour,
Je rencontre un problème avec mon script python3, un problème sans doute déjà rencontrer par pas mal de monde.
Il s'agit, je pense, d'un problème d'encodage des fichiers (le fameux encodage).
Ce script fait parti d'un outil et le principal but de mon script est de parser un fichier texte pour en extraire des données et les enregistrer dans un fichier texte.
Pour vous faire une idée du cheminement des données voici un rapide apperçu du déroulement
1. Un script VBS convertit un document Word au format texte (à l'aide des fonctions incluses dans Word)
2. Ce fichier, d'après la commande 'file' est encodé au format ISO-8859
3. Le script python lit ce fichier, extrait les données et créer un nouveau fichier texte.
Le hic c'est que, par exemple, dans mon document Word j'ai la phrase suivante:
MON_TEXTE = "Ceci est un message"
Dans le fichier temporaire, créer par le script VBS, j'obtiens:
MON_TEXTE = "Ceci est un message"
Après le traitement par python j'obtiens (au mieux):
DISPLAY( ?Ceci est un message? )
Extrait rapide de mon script python
Le script ne tournera que sous environnement Windows et comme dit plus haut, en python3
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 # Read file contenu = list() with open( fichier_origine, 'r' ) as f: for line in f: contenu.append( line.strip() ) # Process extrait = list() for idx in contenu: s = idx.split( ' = ' ) extrait.append( s[1] ) # Write file with open( fichier_final, 'w' ) as f: for idx in extrait: f.write( "DISPLAY(" + idx + " )" )
Merci pour votre aide.
Partager