Bonjour, j'ai une dataframe qui contiennent toute une colonne 'key', qui pourrait être passée comme index, s'il n'y avait pas des doublons. Comment opérer de manière à ce qu'il n'y ait pas de répétition dans la colonne 'key' et que pour les autres colonnes de la ligne, les valeurs soient le résultat de fonctions définies par ailleurs (des règles logiques ,le plus souvent mais pas toujours)de toutes ou partie des colonnes des différentes lignes qui partageaient la même 'key'
Exemple:
dfa=
'key' 'champ_1' 'champ_2' 'champ_3' a b c d e f g h i j k l i j2 k2 l2 a b2 c2 d2
Je voudrais un résultat comme
dfa_update=
'key' 'champ_1' 'champ_2' 'champ_3' a func1(b,b2,c,c2,d,d2) func2(b,b2,c,c2,d,d2) d e f g h i func1(j,j2,k,k2,l,l2) func2(j,j2,k,k2,l,l2) l
J'imagine bien que je dois faire un groupby sur la colonne 'key' mais les modalités pratiques de la fusion m'échappent pour appliquer des fonctions sur les colonnes.
Merci
Partager