IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Choix langage pour recherche massive dans fichiers txt/csv


Sujet :

Langages de programmation

  1. #1
    Nouveau membre du Club
    Inscrit en
    Mars 2004
    Messages
    183
    Détails du profil
    Informations forums :
    Inscription : Mars 2004
    Messages : 183
    Points : 36
    Points
    36
    Par défaut Choix langage pour recherche massive dans fichiers txt/csv
    Hello,

    Je suis à la recherche du meilleur langage pour réaliser le programme suivant : en fonction de certains paramètres, dont une période à définir (minimum 1 mois), je vais devoir lire le contenu des fichiers et rechercher si des mots clefs sont présents dans les fichiers, si oui, conserver les lignes et les réécrire dans un fichier résultat.

    Exemple : Aout 2016, mot clé "toto"

    Je vais devoir parcourir une arborescence jusqu'2016, puis 08 (Aout) et dedans je vais me retrouver avec un dossier par jour qui contient 3 fichiers CSV compressés (TAR.GZ).
    Sur l'un de ces fichiers CSV : je vais devoir décompresser le fichier et lire une "colonne" bien précise (dont il faut séparer avant par la "," chaque données) si elle contient ou pas le mot clé TOTO. Pour chaque ligne je vais devoir la garder dans un tampon (pour l'écrire plus tard) + garder une référence de cette ligne qui me permettra d'aller chercher les autres lignes correspondantes dans les 2 autres fichier (compressés aussi, en CSV aussi) qui seront aussi écrit à la fin.

    A la fin, je dois me retrouver avec 3 fichiers correspondant a la période + mots clés.

    Une idée ?

    Merci

  2. #2
    Modérateur

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2009
    Messages
    1 395
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 395
    Points : 2 002
    Points
    2 002
    Par défaut
    Bonjour,

    ça n'a pas l'air trop sorcier... Du bash avec tar, grep (pour chercher dans le fichier) et cut (pour lire une colonne en particulier) ou sed (pour traiter ligne à ligne) suffisent pour ça. Tu peux faire ça sans trop de mal en python aussi. Si tu es sous Windows, Python sera un meilleur choix que bash. Sous Linux l'un comme l'autre feront l'affaire.
    Documentation officielle GTK+ 3:
    GTK en C, GTK en Python

    Tutoriels GTK+ 3:
    GTK en C, GTK en Python

    Tutoriels par l'exemple (platform-demos):
    GTK (tous langages)

  3. #3
    Membre émérite
    Inscrit en
    Janvier 2011
    Messages
    805
    Détails du profil
    Informations personnelles :
    Localisation : Autre

    Informations forums :
    Inscription : Janvier 2011
    Messages : 805
    Points : 2 918
    Points
    2 918
    Par défaut
    Quel OS ? Un IDE/tooling de prédilection ou ça peut être n'importe lequel ?

    Personnellement j'aurais tendance à faire ça en F# avec le type provider idoine. J'ai fait pas mal de moulinettes de traitement de fichiers avec, le typage automatique à partir du fichier et les primitives fonctionnelles de manipulation de listes simplifient beaucoup la tâche.

  4. #4
    Expert éminent sénior
    Avatar de Marco46
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2005
    Messages
    4 413
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Août 2005
    Messages : 4 413
    Points : 19 609
    Points
    19 609
    Par défaut
    +1 avec liberforce sur l'usage du bash, si la taille des fichiers est conséquente j'utiliserais plutôt Perl que Python. Perl sert très exactement à ce genre de tâches il a été conçu pour.
    Un problème avec Git ? Essayez la FAQ, sinon posez votre question sur le forum.



    "Toute personne croyant qu'une croissance exponentielle peut durer indéfiniment dans un monde fini est soit un fou, soit un économiste."
    Kenneth E. Boulding

    "Les richesses naturelles sont inépuisables, car, sans cela, nous ne les obtiendrions pas gratuitement. Ne pouvant être ni multipliées ni épuisées, elles ne sont pas l’objet des sciences économiques."
    Jean-Baptiste Say, Traité d'économie politique, 1803.

    "/home/earth is 102% full ... please delete anyone you can."
    Inconnu

  5. #5
    Membre éprouvé
    Homme Profil pro
    Administrateur Systèmes, Clouds et Réseaux /CAO/DAO/Ingénierie Electrotechnique
    Inscrit en
    Décembre 2014
    Messages
    449
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Administrateur Systèmes, Clouds et Réseaux /CAO/DAO/Ingénierie Electrotechnique

    Informations forums :
    Inscription : Décembre 2014
    Messages : 449
    Points : 991
    Points
    991
    Par défaut
    J'aurais dit aussi que ça dépendait de ton niveau. Si tu dois apprendre un langage de programmation en aussi peu de temps, je pense que python est franchement désigné pour le compromis puissance, rapidité d'apprentissage. Après il est clair que le bash, quand on connait bien est puissant, des gens pourront te donner même des commandes toutes faites qui en revanche devront te prendre quelques lignes sous Python (mais c'est pas un brin insurmontable du tout, ça fera juste quelques lignes en plus), après la vitesse de travail de Python comparé au Bash, il n'y a pas photo je trouve.

Discussions similaires

  1. Recherche texte dans fichier txt
    Par michelS dans le forum Développement de jobs
    Réponses: 1
    Dernier message: 08/04/2014, 09h54
  2. Réponses: 2
    Dernier message: 16/12/2006, 12h34
  3. Donnee excel pour requete sql dans fichier txt ou doc
    Par Yogi_01 dans le forum Macros et VBA Excel
    Réponses: 6
    Dernier message: 13/04/2006, 10h04
  4. .bat pour l'import de fichier txt dans postgres
    Par pseudomh dans le forum PostgreSQL
    Réponses: 1
    Dernier message: 25/03/2005, 00h02
  5. [Choix de langage] Pour un convertisseur de fichiers
    Par FredBe dans le forum Langages de programmation
    Réponses: 28
    Dernier message: 13/12/2004, 17h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo