Bonjour,
Merci à tous de vos réponse ça me fait vraiment plaisir de voir autant de gens aussi sympas 
Alors, pour l’extraction de fichier, justement j’utilise la librairie pandas qui a un outil :
1 2
| import pandas as pd
data = pd.read_csv('Matrice-client-Colisweb.csv', sep=';') |
Ensuite, je place une clé (si j’ai bien compris) avec la commande suivante :
data.set_index(['client'], inplace=True)
Et voici quelques lignes que j’ai écrite pour avoir des informations, des métriques
1 2 3 4 5
| print(data.groupby(['Type','Magasin','Periode']).aggregate(np.mean))
print(data.groupby(['Type']).aggregate(np.mean))
print(data.groupby(['Magasin']).aggregate(np.mean))
print(data.groupby(['Periode']).aggregate(np.mean))
print(data.groupby(['panier moyen']).aggregate(np.mean)) |
Donc avec cette fonction, j’obtiens directement des moyennes en fonction de la variable que j’ai choisi.
Maintenant veux tracer des histogrammes à partir de ces variables, mais la… je coince…
Je trace l'histograme que je veux avec la fonction suivante :
1 2 3
|
CAPM=(data.groupby(['Panier Moyen']).aggregate(np.mean))
CAPM.hist() |
ou la fonction CAPM est une colonne de mon dataframe. Du coup, j'essaie de rendre ça potable, afficher les noms, mettre de la couleur, mettre une légende... Comment fait on ? Je regarde dans l'aide mais je comprends pas...
Donc voila, je vais regarder ce que je peux faire avec la bibliothèque seaborn, j’ai jetté un œil, et ça a l’air terrible quand même.
En tout cas merci beaucoup pour vos réponses !
Yderien
Partager