IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Lecture d'un fichier texte(format csv) avec des lettres accentuées [Python 3.X]


Sujet :

Python

  1. #1
    Membre du Club
    Homme Profil pro
    Enseignant
    Inscrit en
    Octobre 2015
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Octobre 2015
    Messages : 55
    Points : 64
    Points
    64
    Par défaut Lecture d'un fichier texte(format csv) avec des lettres accentuées
    Bonjour,
    Je fais mes premiers pas avec Python et Pyscripter et bute sur un problème d'accents que je ne sais pas résoudre tant les fils Internet sur le sujet sont nombreux et déroutants.
    J'ai créé avec Notepad++ un fichier csv, 4 champs séparés par des virgules :
    Fichier Notepad au format csv :
    XXXXXX,Pierre,1947,août,7
    YYYYYYY,Bernadette,1948,novembre,5
    XXXXXXYYYYYYYY,Florence,1979,novembre,26
    ZZZZZZZ,Andrée,1927,janvier,09

    Je le lis pour l'imprimer dans la console Python avec le script ci-dessous :
    #
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    import csv
    fic=open('Fichier-00-csv-1.csv')
    fic_donnees=csv.reader(fic)
    nom=[]
    for ligne in fic_donnees:
        print(ligne)
        c1=ligne[0]
        nom.append(c1)
     
    print(nom)
     
    wnom='Andrée'
    print(wnom)
    Quand ce script est lancé, j'obtiens dans la console :
    ['YYYYYYY', 'Bernadette', '1948', 'novembre', '5']
    ['XXXXXXYYYYYYYY', 'Florence', '1979', 'novembre', '26']
    ['ZZZZZZZ', 'Andrée', '1927', 'janvier', '09']
    ['XXXXXX', 'YYYYYYY', 'XXXXXXYYYYYYYY', 'ZZZZZZZ']
    Andrée
    >>>
    Ce script fonctionne correctement quand j'utilise une variable contenant une lettre accentuée (wnom='Andrée') mais ne reconnaît par l'accent quand il est dans le fichier lu par la méthode .reader sur le 4e enregistrement du fichier .
    Ma question : comment faire pour trouver le bon codage du fichier lu et comment le signaler au script Python si c'est nécessaire?

    PS : J'ai "vérifié" autant que je peux et l'encoding du fichier .csv est UTF8, pareil pour le fichier crée par Pyscripter.

    Merci d'avance pour l'aide apportée.
    Je ne suis pas vraiment un "geek" et un peu dérouté par les pistes trouvées sur google pour ce qui concerne les lettres accentuées.

    Mon PC tourne sous Windows 10, mis à jour régulièrement, avec Python 3.6 et Notepad++, également mis à jour.

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Si çà affiche 'Andrée' et non 'Andrée', c'est que les 2 bytes UTF-8 qui codent le 'é' ont été décodés avec un encoding 8 bits comme latin-1.

    Ma question : comment faire pour trouver le bon codage du fichier lu et comment le signaler au script Python si c'est nécessaire?
    Il faut le signaler à "open" qui sinon utilisera l'encoding par défaut du file system avec fic=open('Fichier-00-csv-1.csv', encoding='utf-8').

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre du Club
    Homme Profil pro
    Enseignant
    Inscrit en
    Octobre 2015
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Octobre 2015
    Messages : 55
    Points : 64
    Points
    64
    Par défaut
    Super, facile à mettre en place sans avoir à s'interroger sur l'encoding quand on est tout seul sur son PC.
    Problème résolu.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2010] Convertir plusieurs fichiers excel en csv avec des guillemets
    Par karido-74 dans le forum Macros et VBA Excel
    Réponses: 41
    Dernier message: 29/01/2014, 18h32
  2. REGEX - Repérer des mots avec des lettres accentuées
    Par rambc dans le forum Général Python
    Réponses: 2
    Dernier message: 16/07/2011, 15h33
  3. Lecture fichier texte format personnel
    Par thomtom dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 10/04/2008, 13h18
  4. Réponses: 4
    Dernier message: 18/11/2007, 10h20
  5. Lecture d'un fichier texte avec ligne vide.
    Par cotcouture dans le forum Général Python
    Réponses: 2
    Dernier message: 06/10/2006, 02h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo