Bonjour;
Je débute en Python et j'aurais besoin de votre aide.
Dans mon dataframe (df), j'ai une colonne (FRUIT) qui peut contenir plusieurs valeurs distinctes ("POMMES" ; "POIRES" ; "ORANGES" etc...)
Chaque ligne de mon dataframe, pour cette colonne, ne contiendra qu'une et une seule valeur.
J'aimerais pouvoir, uniquement en se basant sur le colonne FRUIT, savoir dire quel est le pourcentage arrondi à 2 chiffres que peut représenter un fruit (ex : ORANGES") sur la totalité de la colonne FRUIT.ID;FRUIT;
1;'ORANGES';
2;'ORANGES';
3;'POMMES';
4;'ORANGES';
5;'ORANGES';
6;'CITRONS';
7;'CITRONS';
8;'ORANGES';
9;'ORANGES';
10;'ORANGES';
11';ORANGES';
12';'POMMES';
13';ORANGES';
14';ORANGES';
15;'ORANGES';
16;'ORANGES';
17;'ORANGES';
18;'POIRES';
18;'ORANGES';
20;'ORANGES';
Je sais avoir le nombre de chaque modalité de cette colonne :
Mais là ce que je veux c'est avoir (directement ou dans une colonne supplémentaire de df2) le % de chaque valeur de FRUIT.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 df2=df['FRUIT'].value_counts()
Et là je bloque pour avoir directement la valeur de "ORANGES" dans "FRUIT"
Par avance merci
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 round((df.['FRUIT'].sum() * 100) / len(df.['FRUIT']),2)
Cordialement
Partager