Utf-8 et Ascii

**edblv** · 05/01/2011, 17h49

Bonjour, (et bonne année !)

J'écris actuellement un bout de code en Python 2.6 (sous Linux) et j'ai un problème d'UTF-8.

En fait, mon programme lit un fichier TXT avec csv.reader puis parcours les lignes et génère une requête INSERT qui doit être exécutée sur une base MS Sql (2008).

Jusque là, rien d'extraordinaire !
Le problème c'est que dans mon fichier, il y a des noms en Allemand (donc avec des ü et quelques trucs encore plus exotiques), donc au moment ou je crée ma requête, j'ai un méchant message qui me dit :
UnicodeDecodeError: 'ascii' codec can't decode byte 0xfc in position 9: ordinal not in range(128)

Quelqu'un connaît-il une solution ?

Merci d'avance.

**Sve@r** · 06/01/2011, 00h41

Envoyé par edblv

Quelqu'un connaît-il une solution ?

Oui mais il faudrait plus de précisions
1) comment est codé le fichier que tu lis
2) quel est le codage de ta base Sql

Mais on va admettre que ton fichier allemand est encodé en utf8 et que la ligne lue est stockée dans une variable "lig". Et que ta bdd est codée en latin
Ben il faudra que tu fasses un insert de lig.decode("utf-8").encode("latin-1")

**edblv** · 06/01/2011, 10h03

Envoyé par Sve@r

Oui mais il faudrait plus de précisions
1) comment est codé le fichier que tu lis
2) quel est le codage de ta base Sql

Mais on va admettre que ton fichier allemand est encodé en utf8 et que la ligne lue est stockée dans une variable "lig". Et que ta bdd est codée en latin
Ben il faudra que tu fasses un insert de lig.decode("utf-8").encode("latin-1")

Mon fichier TXT est en ASCII pur et dur, il est lu dans un programme en Python dans lequel j'ai indiqué # -*- coding: utf-8 -*-
Je l'ouvre avec :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
NoFic = open(self.Repertoire+"/"+self.FichierCourant,'r')
ReaderCSV= csv.reader(NoFic,delimiter='\t')
self.TblFicCSV=list(ReaderCSV)

...et un peu plus loin, je fais ça :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
for IndCol in range(len(self.TblCorresp)) :
	if LstChamps!="":
		LstChamps+=", "
		LstValues+=", "
 
	NoColFic=self.TblCorresp[IndCol]["NOCOL"]
	LstChamps+=self.TblCorresp[IndCol]["NOMCHAMP"]
	LstValues+=self.TblFicCSV[NoLigne][NoColFic].decode("utf-8").encode("latin-1")
 
	Requete="INSERT INTO dbo."+self.NomTable+" ("+LstChamps+") VALUES ("+LstValues+")"
 
	cur = self.CnxBase.cursor()
	cur.execute(Requete)
	self.CnxBase.commit()

Et ça passe pas !
Sur la ligne ou je fais la concaténation (LstValues+=self.TblFicCSV[NoLigne][NoColFic].decode("utf-8").encode("latin-1") ) j'ai un message d'erreur.

**pfeuh** · 06/01/2011, 10h12

Salut,

Envoyé par edblv

dans mon fichier, il y a des noms en Allemand (donc avec des ü et quelques trucs encore plus exotiques)

Envoyé par edblv

Mon fichier TXT est en ASCII pur et dur

Ne trouves-tu pas ces 2 affirmations un peu contradictoires?

A+

Pfeuh

**edblv** · 06/01/2011, 11h20

Pour préciser mon problème (qui ne déchaîne pas les foules...)

Dans mon fichier TXT il y a ce texte : Josef-Schüttler -Str 17

Si je demande à Python de me l'afficher, il m'affiche ça :
Josef-Sch\xfcttler -Str 17

Si je fait type(MaVariable), il me réponds :
<type 'str'>

Comment puis-je obtenir une variable dans laquelle il y aura :
"INSERT INTO Adresse (Rue1) VALUES ('Josef-Schüttler -Str 17')"

La requête DOIT être construite dynamiquement à partir des champs que je trouve dans le fichier TXT.

J'espère avoir été plus clair.
Je fais ce genre de chose tout les jours en PHP mais je n'y arrive pas en Python

**Sve@r** · 06/01/2011, 11h43

Envoyé par edblv

Pour préciser mon problème (qui ne déchaîne pas les foules...)

Dans mon fichier TXT il y a ce texte : Josef-Schüttler -Str 17

Si je demande à Python de me l'afficher, il m'affiche ça :
Josef-Sch\xfcttler -Str 17

Hum, là déjà il convient de vérifier une chose. Pour afficher, utilises-tu l'ordre
>>> MaVariable
ou bien
>>> print MaVariable
Parce que le résultat n'est pas le même...

Envoyé par edblv

Si je fait type(MaVariable), il me réponds :
<type 'str'>

Comment puis-je obtenir une variable dans laquelle il y aura :
"INSERT INTO Adresse (Rue1) VALUES ('Josef-Schüttler -Str 17')"

Code python :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
order="INSERT INTO Adresse (Rue1) VALUES ('%s')" % MaVariable
print order

Utf-8 et Ascii

Python

Vue hybride

Discussions similaires

Partager

Partager