IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

lire un fichier csv avec caractère bizarre


Sujet :

Python

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    chomeur
    Inscrit en
    Mai 2022
    Messages
    83
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : chomeur

    Informations forums :
    Inscription : Mai 2022
    Messages : 83
    Points : 37
    Points
    37
    Par défaut lire un fichier csv avec caractère bizarre
    bonjour
    j'aimeria lire un fichier csv qui a des caractères bizarre.
    pourtant il semble etre encodé en utf8.
    comment je peux faire pour le lire bien, sans les trucs bizarres comme ca : c�t�


    ci-dessous mon csv:
    "icao24","registration","manufacturericao","manufacturername","model","typecode","serialnumber","linenumber","icaoaircrafttype","operator","operatorcallsign","operatoricao","operatoriata","owner","testreg","registered","reguntil","status","built","firstflightdate","seatconfiguration","engines","modes","adsb","acars","notes","categoryDescription"
    "aa2150","N75187","PIPER","Piper","PA-28-151","P28A","28-7615266","","L1P","","","","","Cunningham Gary L","","","2027-09-30","","1976-01-01","","","LYCOMING 0-320 SERIES","false","false","false","",""
    "c0a2fe","C-IJSV","","Blanchet;bolduc-teasdale;bouchard;c�t�;d'anjou-drouin;demers-bouchard;dicaire;fournier;marineau;meissner;phuctran;trudel","P�GASE (PEGASE)","ULAC","X1","","","","","","","Fran�ois Bolduc-teasdale","","2012-11-08","","","","","","","false","false","false","",""
    "403542","G-MWXY","","Cyclone Airsports Ltd","CHASER S 447","ULAC","CH832","","","","","","","Private","","2009-07-15","","","1992-01-01","","","1 x BRIGGS AND STRATTON 0114-E1&nbsp;&nbsp;( HELICE 166/135/L/3 )<br>","false","false","false","",""

  2. #2
    Expert éminent
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    3 817
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 3 817
    Points : 7 110
    Points
    7 110
    Par défaut
    Bonsoir,

    Comment voyez vous que c'est encodé en UTF-8 ?
    Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
    La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

  3. #3
    Membre chevronné
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Février 2003
    Messages
    1 572
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2003
    Messages : 1 572
    Points : 2 014
    Points
    2 014
    Par défaut
    Passez l'argument encoding="utf-8" à la méthode ou fonction que vous utilisez pour ouvrir le csv.

    Exemples :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    from pathlib import Path
     
    with Path(chemin/vers/le/fichier/csv).open(encoding="utf-8") as infile:
        # la suite est pour vous
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    from csv import DictReader
     
    with open('le_fichier.csv', newline='', encoding="utf-8") as csvfile:
        reader = DictReader(csvfile)
        for row in reader:
            # c'est à vous !

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Salut,

    Vu qu'on a des � un peu partout, il faudrait regarder à quoi cela correspond comme octets (en lisant le fichier en mode binaire) et s'assurer qu'il y a bien autre chose à afficher.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Expert éminent
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    3 948
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 3 948
    Points : 9 276
    Points
    9 276
    Par défaut
    Hello,
    pour bien cerner le problème il faudrait un morceau du fichier csv en pièce jointe car dans le premier message les caractères bizarres doivent être un caractère de substitution (unicode ef bf bd).
    Ami calmant, J.P
    Jurassic computer : Sinclair ZX81 - Zilog Z80A à 3,25 MHz - RAM 1 Ko - ROM 8 Ko

  6. #6
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 684
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 684
    Points : 30 973
    Points
    30 973
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par marietar Voir le message
    pourtant il semble etre encodé en utf8.
    Peut-être qu'il est encodé en utf-8 mais affiché dans un terminal qui, lui, n'est pas en utf-8...
    Il faudrait l'ouvrir déjà avec notepad++ qui te dira l'encoding détecté.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  7. #7
    Membre expérimenté
    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    1 112
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 1 112
    Points : 1 617
    Points
    1 617
    Par défaut
    il est peut-être en UTF-8 mais en utf-8 avec BOM
    https://www.w3.org/International/que...r-mark.fr.html

Discussions similaires

  1. [Jackson] Lire un fichier CSV avec Jackson
    Par Beltharion dans le forum Documents
    Réponses: 4
    Dernier message: 19/09/2017, 18h15
  2. Lire un fichier csv avec séparateur ";"
    Par Invité dans le forum C++/CLI
    Réponses: 7
    Dernier message: 05/11/2015, 21h00
  3. Réponses: 11
    Dernier message: 07/10/2011, 09h19
  4. Lire un fichier CSV envoyé avec une requête POST
    Par Marm B dans le forum Langage
    Réponses: 6
    Dernier message: 26/08/2009, 13h31
  5. [AC-2003] Lire un fichier CSV de 170Mo avec Access
    Par mmmxtina dans le forum VBA Access
    Réponses: 12
    Dernier message: 15/07/2009, 13h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo