Bonjour,
Je dispose d'un dataframe issus d'un sondage, où chaque répondant devait noter de 0 (Aucune connaissance) à 5 (Très compétent) un certain nombre de compétence, parmis les statistiques, le traitement de données, la cartographie, les bases de données, et la télédétection.
Image : https://zupimages.net/viewer.php?id=20/32/dwtu.png
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 import pandas as pd import matplotlib.pyplot as plt import numpy as np import statistics as stats df = pd.DataFrame({'prenom' : ["Personne1", "Personne2", "Personne3", "Personne4", "Personne5", "Personne6", "Personne8", "Personne9", "Personne10", "Personne11", "Personne12", "Personne13", "Personne14", "Personne15", "Personne16", "Personne17", "Personne18", "Personne19", "Personne20"], "statistique" : np.random.random_integers(0, 5, 19), "traitement_de_donnees" : np.random.random_integers(0, 5, 19), "cartographie" : np.random.random_integers(0, 5, 19), "base_de_donnee" : np.random.random_integers(0, 5, 19), "teledetection" : np.random.random_integers(0, 5, 19)})
J'aimerais pouvoir créer 5 groupes de personnes. Ces groupes devront répartir au mieux les scores des compétences. L'idée, c'est de ne pas avoir certains groupes avec des personnes compétentes dans tous les domaines ou, au contraire, avoir certains groupes avec que des personnes non-compétentes dans les domaines.
Ce que je pensais faire, c'est calculer la médiane pour chacune des compétences, et me baser sur ces valeurs comme "minimum". Il y a aussi une notion de réutilisation des personnes. Effectivement, une personne ne peut pas être placée dans plusieurs groupes à la fois.
Est-il possible de faire ceci sur Python ?
Merci.
Partager