Bonjour,
je dois calculer les percentiles sur une série temporelle malheureusement j'avoue que mes notions de math remontent à très loin et se sont un peu délitées avec le temps et j'ai besoin d'avoir la confirmation que la logique que j'emploie est correcte ... donc soyez indulgents s'il vous plait
J'ai donc réduit mes données pour avoir en entrée une liste de dictionnaires {<valeur de la mesure>:<nombre de mesures ayant la même valeur>}
Sur cette liste, j'applique le traitement suivant :
1- Tri de la liste par ordre croissant de <valeur de la mesure>
2- Calcul du rang absolu de chaque dictionnaires en arrondissant à l'entier supérieur : <index de la map>*<nombre de mesures ayant la même valeur>+<nombre de mesures ayant la même valeur>-1/<nombre de mesures ayant la même valeur>
3- Calcul du pourcentage de chaque map : <nombre de mesures ayant la même valeur>*100/<nombre total de mesures>
4- Calcul du pourcentage cumulatif de chaque map : <pourcentage cumulé map précédente ou 0>+<pourcentage de la map>
5- Calcul du rang percentile : <pourcentage cumulatif de la map>-<pourcentage de la map>+(0,5*<pourcentage de la map>)
C'est bien ça ?
Par contre, par convention, qu'est ce qui est toléré au niveau des calculs intervenant dans celui des percentiles, on arrondi systématiquement à l'entier supérieur pour les entier et à la décimale supérieur pour les pourcentages ?
De la même façon comment fait on quand une tranche percentile est "manquante", on fait une interpolation de la tranche précédente et de la tranche suivante ?
Merci à tous pour vos interventions
Partager