Bonjour,
Soit un dataframe avec en indice six matériaux (stone, limestone, clay, sandstone, gypsum, slate), chaque matérau se répètant une fois (donc 12 lignes) une première colonne indiquant le type de données (observation ou maximum tolérable) et 20 colonnes correspondant à des paniers pour chacun desquels on observe une valeur (type de donnée : observation) et on connait un maximum tolérable (type de donnée : maximum). L'objectif est de déterminer pour chaque matériau et chaque panier le ratio observation / maximum. Comment pourrait on coder cela en Python ? Ci-joint un fichier Excel montrant le dataframe en entrée et le dataframe de sortie attendu.
exemle.xlsxexemle.xlsxexemle.xlsx
En réalité le nombre de matériaux étudié est très grand (des centaines voire des milliers de lignes) et le nombre de panier important (plusieurs dizaines voire centaines) et les données changent chaque jour d'où la nécessité d'automatiser
Merci pour votre aide !
Partager