IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

pandas - Lookup dans un dict


Sujet :

Python

  1. #1
    Membre actif Avatar de BioKore
    Homme Profil pro
    Dresseur d'Alpaga
    Inscrit en
    Septembre 2016
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Dresseur d'Alpaga

    Informations forums :
    Inscription : Septembre 2016
    Messages : 300
    Points : 219
    Points
    219
    Par défaut pandas - Lookup dans un dict
    Bonjour à tous,

    Je cherche depuis un petit moment comment mettre à jour un DataFrame (ou plus précisément un Series) à partir d'une autre table.
    en effet; à partir d'une colonne 'data' par exemple, définir le groupe auquel appartient la donnée selon un autre tableau.

    voici un exemple du dict à utiliser :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    dct = {
        'grpA': list('azerty'),
        'grpB': list('bhvb'),
        'grpC': list('pmlnqwptver')
        #...
    }
    et le résultat attendu:
    data groupe
    a grpA
    b grpB
    l grpC
    c NaN

    *pour info, ne pas tenir compte des valeurs présentes dans plusieurs groupes à la fois. Mes données réelles en contiennent effectivement, mais je peux me débrouiller pour les retirer. Je comprends bien que ceci n'est plus un problème de code mais de contexte (quoi que..)

    Je pense m'approcher de la solution avec un code du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df['Groupe'] = df.data.apply(lambda x: val for val in dct.keys() if (x in dct[val]))
    mais le hic, c'est que ceci ne fonctionne pas. j'ai alors utilisé le code suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df['Groupe'] = df.data.apply(lambda x: [val for val in dct.keys() if (x in dct[val])])
    et cette fois j'ai les valeurs mais en liste (ex: [grpA], [grpB] etc...)
    Bien entendu; si j'inverse le if et le for, je peux enfin mettre une valeur par défaut, mais on entre jamais dans la boucle...

    Bref, je me dis qu'il doit bien exister un moyen bien plus simple et général que ce que j'essaie de faire.

    Auriez-vous une idée sur le sujet ?
    Merci par avance !

  2. #2
    jmv
    jmv est déconnecté
    Membre confirmé Avatar de jmv
    Profil pro
    Enseignant
    Inscrit en
    Mai 2004
    Messages
    395
    Détails du profil
    Informations personnelles :
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Mai 2004
    Messages : 395
    Points : 603
    Points
    603
    Par défaut
    Bonjour,
    je ne connais rien à Panda et donc aux DataFrame et Series, je suis donc peut-être à côté de la plaque.

    Qu'est-ce que ça donne si tu crée une fonction f() pour remplacer ta fonction lambda ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    def f(data):
        for groupe,val in dct.items():
            if data in val:
                return groupe
        return None # ou autre chose
    Et ensuite faire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df['Groupe'] = df.data.apply(f)

  3. #3
    Membre actif Avatar de BioKore
    Homme Profil pro
    Dresseur d'Alpaga
    Inscrit en
    Septembre 2016
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Dresseur d'Alpaga

    Informations forums :
    Inscription : Septembre 2016
    Messages : 300
    Points : 219
    Points
    219
    Par défaut
    Salut,

    merci jmv pour ce retour qui réponds effectivement au problème ; tu as donc vu juste. Cependant, je souhaite encore trouver s'il n'existe pas une manière plus à la mode "Pandas" de réaliser ça, fonctionnant ainsi aussi bien pour un dict qu'un quelconque DataFrame.

    Aussi, pourquoi ne suis-je pas en mesure de reformuler cette fonction, pourtant très simple, en une seule ligne ?

  4. #4
    jmv
    jmv est déconnecté
    Membre confirmé Avatar de jmv
    Profil pro
    Enseignant
    Inscrit en
    Mai 2004
    Messages
    395
    Détails du profil
    Informations personnelles :
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Mai 2004
    Messages : 395
    Points : 603
    Points
    603
    Par défaut
    Citation Envoyé par BioKore Voir le message
    Cependant, je souhaite encore trouver s'il n'existe pas une manière plus à la mode "Pandas" de réaliser ça, fonctionnant ainsi aussi bien pour un dict qu'un quelconque DataFrame.
    Je ne vois pas en quoi Panda t'oblige à utiliser une fonction lambda .

    Citation Envoyé par BioKore Voir le message
    pourquoi ne suis-je pas en mesure de reformuler cette fonction, pourtant très simple, en une seule ligne ?
    La 1ère qualité d'un code (à partir du moment où il donne la bonne réponse) est sa lisibilité. Ça peut-être un défi pour toi de réussir à écrire cette fonction en une seule ligne mais je ne suis pas certain que ta fonction sera plus lisible que la mienne (et je ne prétends pas avoir pondu le code le plus lisible qui soit).

    Il m'est arrivé d'écrire des trucs complexes en une seule ligne, mais quand je relis ça un mois plus tard, j'ai du mal à comprendre mon propre code, je préfère des opérations séparées sur plusieurs lignes, enfin c'est mon humble avis.

  5. #5
    Membre actif Avatar de BioKore
    Homme Profil pro
    Dresseur d'Alpaga
    Inscrit en
    Septembre 2016
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Dresseur d'Alpaga

    Informations forums :
    Inscription : Septembre 2016
    Messages : 300
    Points : 219
    Points
    219
    Par défaut
    Citation Envoyé par jmv Voir le message
    Je ne vois pas en quoi Panda t'oblige à utiliser une fonction lambda .
    il ne m'y oblige pas ; justement, la solution que tu donnes fonctionne bien. dans le cas présent donc c'est correct pour moi ; cependant, j'imagine que Pandas offre des solutions plus "directes" pour ce genre de problème. La bibliothèque est spécialisée dans l'analyse et le traitement des données, activité qui demande souvent (dans ma situation en tout cas) d'effectuer des "mapping" entre plusieurs tables. Je serais surpris d'apprendre que pandas n'offre pas de fonctionnalité pour ce type d'action, autrement que par merging/concaténation.

    le fait d'écrire cette fonction en une ligne n'est pas vraiment un défi non plus ; mais c'est juste que, dans le principe de python, je ne vois pas en quoi les méthodes que j'ai essayé ne fonctionnent pas (je peux mettre un if... else... avant la boucle mais uniquement un if... si après la boucle). Je suis entièrement d'accord avec toi concernant l'importance de la lisibilité, principe important pour tout langage de programmation selon moi, bien que j'ai effectivement encore énormément de progrès à réaliser dans ce domaine.

Discussions similaires

  1. lookup dans le jndi
    Par coolcoolcool dans le forum Glassfish et Payara
    Réponses: 10
    Dernier message: 02/09/2010, 11h29
  2. lookup dans dbgrid
    Par looping dans le forum Bases de données
    Réponses: 1
    Dernier message: 26/10/2008, 09h16
  3. Comment afficher un LookUp dans un DBGrid à l’execution ?
    Par nanolo dans le forum Bases de données
    Réponses: 2
    Dernier message: 17/09/2008, 14h52
  4. [Lazarus] Champ LookUp dans un TDBGrid
    Par SSJ17Vegeta dans le forum Lazarus
    Réponses: 1
    Dernier message: 14/09/2008, 19h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo