Bonjour à tous,
Pour un projet perso, je cherche à utiliser Python pour travailler sur des fichiers csv avec des formats et des données complément hétérogènes, je m'explique :
- plusieurs fichier csv en input, tous différents dans leur format, leur taille, l'ordre des colonnes, comportant tous les mêmes données mais avec des formats très différents. Par exemple la colonne des dates (sans toujours un titre de colonne) en "2021/03/01" ou "01-03-2021" , les colonnes dans des ordres différents etc...
- Je voudrais utiliser Python pour analyser ces fichiers, "détecter " ces dates et les sortir en output sur un format tableau commun. Les formats sont différents, sans titre de colonne et sans ordre commun donc difficilement identifiable pour du parsing classique.
Est-ce que Python est le bon outil ?
Merci pour votre aide et vos avis et bonne journée
Nico
Partager