IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Comment agréger des valeurs depuis un fichier CSV avec des clés identiques (Python 2.5)


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    46
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 46
    Par défaut Comment agréger des valeurs depuis un fichier CSV avec des clés identiques (Python 2.5)
    Bonjour,

    Voilà j'ai un fichier CSV déjà trié (par les clés) avec des clés et des valeurs, je traite le fichier dès que la clé change je souhaite rajouter une ligne avec les totaux agrégés des clés identiques, exemple:

    FRA009999 1 2
    FRA009999 3 9
    FRA009999 2 10
    FRA008888 1 2
    FRA008877 6 2
    FRA008877 5 2


    Résultat du fichier final ou dictionnaire attendu
    :
    FRA009999 1 2
    FRA009999 3 9
    FRA009999 2 10
    TTX_____: 6 21 ...le total pour les lignes avec les mêmes clés.
    FRA008888 1 2
    TTX_____: 1 2
    FRA008877 6 2
    FRA008877 5 2
    TTX_____: 11 4


    Avez-vous une idée simple?
    Merci,

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Le plus simple serait de surcharger __missing__ d'une s/classe de dict pour l'initialiser a [0, 0] au premier accès.
    Ca donne:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    >>> class DD(dict):
    ...     def __missing__(self, k):
    ...         v = self[k] = [0, 0]
    ...         return v
    ...
    Et ca s'utilise ainsi:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    >>> dd = DD()
    >>> for k, u, v in g_data(lines):
    ...     dd[k][0] += u
    ...     dd[k][1] +=v
    ...
    >>> dd
    {'FRA008888': [1, 2], 'FRA008877': [11, 4], 'FRA009999': [6, 21]}
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    46
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 46
    Par défaut
    g_data(lines) je comprends pas?

    En général j'utilise un objet oReader = csv.reader(....)

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Citation Envoyé par davtypo3 Voir le message
    g_data(lines) je comprends pas?

    En général j'utilise un objet oReader = csv.reader(....)
    Certes!
    g_data est un générateur qui retourne a chaque itération, les (k, u, v) construits a partir de l'exemple:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    FRA009999 1 2
    FRA009999 3 9
    FRA009999 2 10
    FRA008888 1 2
    FRA008877 6 2
    FRA008877 5 2
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    46
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 46
    Par défaut
    Désolé me manquait le int(value) pour que cela fonctionne, c'est bon maintenant, sur le même modèle des gens utilisent:
    from itertools import groupby as gb + from operator import itemgetter as ig
    ou bien une usine à gaz avec defaultdict
    Votre solution est la plus simple/courte, merci.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 12
    Dernier message: 12/07/2012, 21h15
  2. Réponses: 11
    Dernier message: 15/02/2011, 17h25
  3. Réponses: 2
    Dernier message: 13/03/2007, 11h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo