Vérification intégrité de données décrites dans des fichiers csv
Bonjour à tous,
Tout est à peu près dans le titre. Je vais essayer d'être synthétique:
Je travaille sur un système basé sur un progiciel depuis lequel sont extraites des données sous forme de fichiers .csv.
Ces mêmes fichiers csv sont fournis ensuite à d'autres systèmes. Je souhaite donc, avant l'étape de diffusion, faire des vérifications minimales (intégrité, format de données, quelques vérifications fonctionnelles) pour maximiser la qualité de la donnée. Aujourd'hui tout ça est fait "manuellement" par des personnes de l'équipe mais j'aimerais qu'à terme ce soit automatisé quand on sera en production et que ça tournera.
Du peu de connaissance que j'en avais il me semblait que Talend (ou un autre ETL) était capable de faire ça mais je n'en suis pas certain. Je vous sollicite donc pour avoir vos avis sur la faisabilité de la chose, vos avis, vos suggestions sur le sujet. Je précise que j'ai posté dans le forum Talend. Si toutefois, ça ne vous semblait pas approprié, n'hésitez pas à déplacer le post. Merci d'avance pour vos réponses. A bientôt.