Bonjour à tous,
Je me lance sur Python et je bute sur un besoin de traitement d'un fichier CSV.
Je souhaiterais pouvoir nettoyer une colonne (la 3ème) en ne conservant que les premiers éléments avant un séparateur (en l'occurrence "-"), puis passer au pack suivant et ainsi de suite.
Ultimement, j'aimerais pouvoir supprimer les doublons dans les résultats, et générer un output CSV propre.
Voici un fichier d'exemple avec la source à gauche et le résultat souhaité à droite.
Merci par avance si quelqu'un a du temps.
NOTE : voici ma base de travail, mais étrangement ce bout de code efface tout mon fichier, je ne sais pas pourquoi.
G.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 import csv import re r = csv.reader(open('.../test.csv')) with open('.../test2.csv', 'w') as csvfile: writer = csv.writer(csvfile, delimiter=',') for row in r: row[2] = re.sub('\-.*', '', row[2]) writer.writerow(row)[ATTACH]235343[/ATTACH][ATTACH]235343[/ATTACH]
Partager