IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Utf-8 et Ascii


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    121
    Détails du profil
    Informations personnelles :
    Âge : 60
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Juin 2006
    Messages : 121
    Par défaut Utf-8 et Ascii
    Bonjour, (et bonne année !)

    J'écris actuellement un bout de code en Python 2.6 (sous Linux) et j'ai un problème d'UTF-8.

    En fait, mon programme lit un fichier TXT avec csv.reader puis parcours les lignes et génère une requête INSERT qui doit être exécutée sur une base MS Sql (2008).

    Jusque là, rien d'extraordinaire !
    Le problème c'est que dans mon fichier, il y a des noms en Allemand (donc avec des ü et quelques trucs encore plus exotiques), donc au moment ou je crée ma requête, j'ai un méchant message qui me dit :
    UnicodeDecodeError: 'ascii' codec can't decode byte 0xfc in position 9: ordinal not in range(128)

    Quelqu'un connaît-il une solution ?

    Merci d'avance.

  2. #2
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 830
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 830
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par edblv Voir le message
    Quelqu'un connaît-il une solution ?
    Oui mais il faudrait plus de précisions
    1) comment est codé le fichier que tu lis
    2) quel est le codage de ta base Sql

    Mais on va admettre que ton fichier allemand est encodé en utf8 et que la ligne lue est stockée dans une variable "lig". Et que ta bdd est codée en latin
    Ben il faudra que tu fasses un insert de lig.decode("utf-8").encode("latin-1")
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Membre confirmé
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    121
    Détails du profil
    Informations personnelles :
    Âge : 60
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Juin 2006
    Messages : 121
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    Oui mais il faudrait plus de précisions
    1) comment est codé le fichier que tu lis
    2) quel est le codage de ta base Sql

    Mais on va admettre que ton fichier allemand est encodé en utf8 et que la ligne lue est stockée dans une variable "lig". Et que ta bdd est codée en latin
    Ben il faudra que tu fasses un insert de lig.decode("utf-8").encode("latin-1")
    Mon fichier TXT est en ASCII pur et dur, il est lu dans un programme en Python dans lequel j'ai indiqué # -*- coding: utf-8 -*-
    Je l'ouvre avec :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    NoFic = open(self.Repertoire+"/"+self.FichierCourant,'r')
    ReaderCSV= csv.reader(NoFic,delimiter='\t')
    self.TblFicCSV=list(ReaderCSV)
    ...et un peu plus loin, je fais ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    for IndCol in range(len(self.TblCorresp)) :
    	if LstChamps!="":
    		LstChamps+=", "
    		LstValues+=", "
     
    	NoColFic=self.TblCorresp[IndCol]["NOCOL"]
    	LstChamps+=self.TblCorresp[IndCol]["NOMCHAMP"]
    	LstValues+=self.TblFicCSV[NoLigne][NoColFic].decode("utf-8").encode("latin-1")
     
    	Requete="INSERT INTO dbo."+self.NomTable+" ("+LstChamps+") VALUES ("+LstValues+")"
     
    	cur = self.CnxBase.cursor()
    	cur.execute(Requete)
    	self.CnxBase.commit()
    Et ça passe pas !
    Sur la ligne ou je fais la concaténation (LstValues+=self.TblFicCSV[NoLigne][NoColFic].decode("utf-8").encode("latin-1") ) j'ai un message d'erreur.

  4. #4
    Membre Expert
    Profil pro
    Développeur en systèmes embarqués retraité
    Inscrit en
    Mars 2006
    Messages
    952
    Détails du profil
    Informations personnelles :
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Développeur en systèmes embarqués retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2006
    Messages : 952
    Par défaut
    Salut,

    Citation Envoyé par edblv Voir le message
    dans mon fichier, il y a des noms en Allemand (donc avec des ü et quelques trucs encore plus exotiques)
    Citation Envoyé par edblv Voir le message
    Mon fichier TXT est en ASCII pur et dur
    Ne trouves-tu pas ces 2 affirmations un peu contradictoires?

    A+

    Pfeuh

  5. #5
    Membre confirmé
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    121
    Détails du profil
    Informations personnelles :
    Âge : 60
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Juin 2006
    Messages : 121
    Par défaut
    Pour préciser mon problème (qui ne déchaîne pas les foules...)

    Dans mon fichier TXT il y a ce texte : Josef-Schüttler -Str 17

    Si je demande à Python de me l'afficher, il m'affiche ça :
    Josef-Sch\xfcttler -Str 17

    Si je fait type(MaVariable), il me réponds :
    <type 'str'>

    Comment puis-je obtenir une variable dans laquelle il y aura :
    "INSERT INTO Adresse (Rue1) VALUES ('Josef-Schüttler -Str 17')"

    La requête DOIT être construite dynamiquement à partir des champs que je trouve dans le fichier TXT.

    J'espère avoir été plus clair.
    Je fais ce genre de chose tout les jours en PHP mais je n'y arrive pas en Python

  6. #6
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 830
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 830
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par edblv Voir le message
    Pour préciser mon problème (qui ne déchaîne pas les foules...)

    Dans mon fichier TXT il y a ce texte : Josef-Schüttler -Str 17

    Si je demande à Python de me l'afficher, il m'affiche ça :
    Josef-Sch\xfcttler -Str 17
    Hum, là déjà il convient de vérifier une chose. Pour afficher, utilises-tu l'ordre
    >>> MaVariable
    ou bien
    >>> print MaVariable
    Parce que le résultat n'est pas le même...

    Citation Envoyé par edblv Voir le message
    Si je fait type(MaVariable), il me réponds :
    <type 'str'>

    Comment puis-je obtenir une variable dans laquelle il y aura :
    "INSERT INTO Adresse (Rue1) VALUES ('Josef-Schüttler -Str 17')"
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    order="INSERT INTO Adresse (Rue1) VALUES ('%s')" % MaVariable
    print order
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 26/05/2009, 15h08
  2. Transformation code ASCII en UTF-8
    Par identifiant_bidon dans le forum Langage
    Réponses: 1
    Dernier message: 13/11/2007, 14h56
  3. [.NET 2.0] Convertir une chaine utf-8 en Ascii
    Par abelman dans le forum Framework .NET
    Réponses: 2
    Dernier message: 30/04/2007, 20h47
  4. Conversion utf-8 an code ascii
    Par Haplo2006 dans le forum Langage
    Réponses: 2
    Dernier message: 22/03/2007, 10h11
  5. [C#] Encodage en UTF et ASCII
    Par Machjaghjolu dans le forum C#
    Réponses: 3
    Dernier message: 11/11/2005, 02h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo