[os]Problème de lecture fichier

**LoLesK** · 18/04/2008, 09h50

Bonjour à tous,
j'ai actuellement besoin de créer un script python tout ce qui a de plus simple, il ouvre un fichier, extrait tout ce qu'il faut par rapport à un séparateur spécifique.

J'ai donc un fichier texte, que j'ai extrait de Active Directory via CSVDE, et je voudrais maintenant traité ce fameux fichier texte, problème, je n'arrive pas a "bien" lire le fichier, à noter que je suis actuellement sous Vista, peut-être est-ce un bug venant de l'OS, et je suis actuellement avec la version 2.5.2 de python, bref passons au problème.

Lors de l'ouverture de ce fichier via un éditeur de texte quelconque, on a bien un fichier tout ce qu'il y a de plus normal, ex :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
 
A enlever1 ", A extraire1
A enlever2 ", A extraire2

Suite à l'exécution du code suivant :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
 
import os
 
ofi = open('fich_export.txt', 'r')
while 1 :
    line = ofi.readline()
    if not line : break 
    else:
        print line

Ca nous donne :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

 A   e n l e v e r 2   " ,   A   e x t r a i r e 2

Noter que python a mis un espace entre chaque caractère de mon code, lors de la réécriture de tout ça dans un fichier, le problème persiste même avec un éditeur de texte.

C'est donc ici que je bloque, j'ai pensé à un caractère spécial entre chaque caractère, mais je n'ai pas réussi à l'extraire. J'ai regardé un petit peu du côté de l'encodage, mais je n'ai rien trouvé. J'ai bien évidemment fouillé la docs, mais rien à ce sujet, je n'est peut-être pas été assez perspicace, bref !

Donc voilà en espérant que quelqu'un pourrait éclairer ma lanterne sur ce sujet.

EDIT : Petite erreur dans mon code corrigée

C'était une ancienne version, le problème persiste !

EDIT2 : J'ai trouvé la cause du problème, il y a des caractère au code ASCII 00 qui se mette entre chaque champ. Maintenant il me reste plus qu'à les enlever.

Si quelqu'un a une idée comment faire, j'avais pensé à lire le fichier 8 bits / 8bits, mais il retourne quoi dans ce cas

**Thierry Chappuis** · 18/04/2008, 10h51

Chez moi, c'est OK. Ca me semble toutefois plus simple et pythonique d'écrire:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
ofi = open('fich_export.txt', 'r')
for ligne in ofi:
    print ligne

Thierry

**LoLesK** · 18/04/2008, 10h58

Comme je le disait plus haut (dans mes différents EDIT

), à l'export avec csvde des comptes active directory, ce salaud me rajoute des caractères NUL (code héxa : 00 ) entre chaque caractère et python semble interprété ça comme un espace quand il doit l'écrire, donc maintenant faut que je supprime ces caractères avant de pouvoir faire mon traitement.

Merci pour ta réponse, je ne code presque jamais en python, donc je ne connais pas les manières de coder.

Voilà, donc si maintenant quelqu'un sais comment lire les byte d'un fichier en python

ca m'intéresse fortement

, il n'y a pas de fonction readBytes comme en java et c'est bien dommage !

EDIT: Pardon bit par bit et non pas byte par byte

(octet / octet)

**oiffrig** · 18/04/2008, 11h14

Le mieux à faire et de lire ton fichier en binaire (open('fichier.txt', 'rb'))
Mais alors readlines risque de ne plus fonctionner correctement, il va falloir que tu utilises read.

**LoLesK** · 18/04/2008, 11h25

Merci oiffrig, en fait j'avais déjà utilisé le rb, mais ca ne marche pas, il faut apparement utilisé rU pour que l'OS le lise en tant que binaire, mais il faut aussi que le fichier ne soit pas spécifié comme texte, or j'avais laissé comme extension de fichier .txt (très malin pas vrai), donc ca ne marchait pas.

Je laisse mon code, si ca intéresse quelqu'un :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
import os
 
ofi = open('fich_export', 'rU')
outputfile = open('fich_export2','w')
string = ""
 
while 1 :
    char = ofi.read(8)
    if not char  : break
    else:
        if char != "00000000":
            string += char
outputfile.write(string)
outputfile.flush()
outputfile.close()
ofi.close()

Bon voilà je suppose qu'il y a de plus belle syntaxe, mais j'en suis relativement content

Merci pour tout l'aide apporter! En espérant que ça puisse aidé quelqu'un un jour

[os]Problème de lecture fichier

Python

Vue hybride

Discussions similaires

Partager

Partager