IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

lire un fichier csv avec caractère bizarre


Sujet :

Python

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    chomeur
    Inscrit en
    Mai 2022
    Messages
    88
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : chomeur

    Informations forums :
    Inscription : Mai 2022
    Messages : 88
    Points : 38
    Points
    38
    Par défaut lire un fichier csv avec caractère bizarre
    bonjour
    j'aimeria lire un fichier csv qui a des caractères bizarre.
    pourtant il semble etre encodé en utf8.
    comment je peux faire pour le lire bien, sans les trucs bizarres comme ca : c�t�


    ci-dessous mon csv:
    "icao24","registration","manufacturericao","manufacturername","model","typecode","serialnumber","linenumber","icaoaircrafttype","operator","operatorcallsign","operatoricao","operatoriata","owner","testreg","registered","reguntil","status","built","firstflightdate","seatconfiguration","engines","modes","adsb","acars","notes","categoryDescription"
    "aa2150","N75187","PIPER","Piper","PA-28-151","P28A","28-7615266","","L1P","","","","","Cunningham Gary L","","","2027-09-30","","1976-01-01","","","LYCOMING 0-320 SERIES","false","false","false","",""
    "c0a2fe","C-IJSV","","Blanchet;bolduc-teasdale;bouchard;c�t�;d'anjou-drouin;demers-bouchard;dicaire;fournier;marineau;meissner;phuctran;trudel","P�GASE (PEGASE)","ULAC","X1","","","","","","","Fran�ois Bolduc-teasdale","","2012-11-08","","","","","","","false","false","false","",""
    "403542","G-MWXY","","Cyclone Airsports Ltd","CHASER S 447","ULAC","CH832","","","","","","","Private","","2009-07-15","","","1992-01-01","","","1 x BRIGGS AND STRATTON 0114-E1&nbsp;&nbsp;( HELICE 166/135/L/3 )<br>","false","false","false","",""

  2. #2
    Expert éminent
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    3 895
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 3 895
    Points : 7 254
    Points
    7 254
    Par défaut
    Bonsoir,

    Comment voyez vous que c'est encodé en UTF-8 ?

  3. #3
    Membre chevronné
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Février 2003
    Messages
    1 582
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2003
    Messages : 1 582
    Points : 2 030
    Points
    2 030
    Par défaut
    Passez l'argument encoding="utf-8" à la méthode ou fonction que vous utilisez pour ouvrir le csv.

    Exemples :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    from pathlib import Path
     
    with Path(chemin/vers/le/fichier/csv).open(encoding="utf-8") as infile:
        # la suite est pour vous
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    from csv import DictReader
     
    with open('le_fichier.csv', newline='', encoding="utf-8") as csvfile:
        reader = DictReader(csvfile)
        for row in reader:
            # c'est à vous !

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 331
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 331
    Points : 36 851
    Points
    36 851
    Par défaut
    Salut,

    Vu qu'on a des � un peu partout, il faudrait regarder à quoi cela correspond comme octets (en lisant le fichier en mode binaire) et s'assurer qu'il y a bien autre chose à afficher.

    - W

  5. #5
    Expert éminent
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 036
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 036
    Points : 9 443
    Points
    9 443
    Par défaut
    Hello,
    pour bien cerner le problème il faudrait un morceau du fichier csv en pièce jointe car dans le premier message les caractères bizarres doivent être un caractère de substitution (unicode ef bf bd).
    Ami calmant, J.P

  6. #6
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 721
    Points : 31 044
    Points
    31 044
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par marietar Voir le message
    pourtant il semble etre encodé en utf8.
    Peut-être qu'il est encodé en utf-8 mais affiché dans un terminal qui, lui, n'est pas en utf-8...
    Il faudrait l'ouvrir déjà avec notepad++ qui te dira l'encoding détecté.

  7. #7
    Membre chevronné
    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    1 269
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 1 269
    Points : 1 851
    Points
    1 851
    Par défaut
    il est peut-être en UTF-8 mais en utf-8 avec BOM
    https://www.w3.org/International/que...r-mark.fr.html

Discussions similaires

  1. [Jackson] Lire un fichier CSV avec Jackson
    Par Beltharion dans le forum Documents
    Réponses: 4
    Dernier message: 19/09/2017, 18h15
  2. Lire un fichier csv avec séparateur ";"
    Par Invité dans le forum C++/CLI
    Réponses: 7
    Dernier message: 05/11/2015, 21h00
  3. Réponses: 11
    Dernier message: 07/10/2011, 09h19
  4. Lire un fichier CSV envoyé avec une requête POST
    Par Marm B dans le forum Langage
    Réponses: 6
    Dernier message: 26/08/2009, 13h31
  5. [AC-2003] Lire un fichier CSV de 170Mo avec Access
    Par mmmxtina dans le forum VBA Access
    Réponses: 12
    Dernier message: 15/07/2009, 13h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo