Hello,
Je suis à la recherche du meilleur langage pour réaliser le programme suivant : en fonction de certains paramètres, dont une période à définir (minimum 1 mois), je vais devoir lire le contenu des fichiers et rechercher si des mots clefs sont présents dans les fichiers, si oui, conserver les lignes et les réécrire dans un fichier résultat.
Exemple : Aout 2016, mot clé "toto"
Je vais devoir parcourir une arborescence jusqu'2016, puis 08 (Aout) et dedans je vais me retrouver avec un dossier par jour qui contient 3 fichiers CSV compressés (TAR.GZ).
Sur l'un de ces fichiers CSV : je vais devoir décompresser le fichier et lire une "colonne" bien précise (dont il faut séparer avant par la "," chaque données) si elle contient ou pas le mot clé TOTO. Pour chaque ligne je vais devoir la garder dans un tampon (pour l'écrire plus tard) + garder une référence de cette ligne qui me permettra d'aller chercher les autres lignes correspondantes dans les 2 autres fichier (compressés aussi, en CSV aussi) qui seront aussi écrit à la fin.
A la fin, je dois me retrouver avec 3 fichiers correspondant a la période + mots clés.
Une idée ?
Merci
Partager