IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Mathématiques Discussion :

Algorithmes des calculs des quantiles (percentil ou quartile sous excel)


Sujet :

Mathématiques

  1. #1
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut Algorithmes des calculs des quantiles (percentil ou quartile sous excel)
    Salut,

    Quelqu'un connait il les algorithmes pour calculer les quantiles d'une liste de chiffres. Exemple : liste de 1 à 10.

    Je tiens à préciser que sur le web, on trouve tout et n'importe quoi.

    Remarque : Prenons les valeurs 1, 2, 3, 4, 5, 6, 7, 8, 9 et 10
    Sous excel
    Q0 = 1 C'est la valeur minimale
    Q1 = 3.25 ???
    Q2=5.5 C'est la médiane du tableau
    Q3= 7.75 ???
    Q4 = 10 C'est la valeur maximale

    En utilisant le langage statistique R
    Code R : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    > x<-1:10
    > quantile(x,type=LETYPE)
    Il est possible de calculer 9 types de quantile.
    Type 1 correspond à l’inverse de la fonction de répartition empirique,
    Type 2 fait une moyenne des statistiques d’ordre pour corriger de la discontinuité,
    Type 3 est la définition de SAS, i.e. prendre la statistique d’ordre la plus proche,
    Type 4 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k), où p(k) = k / n, i.e. linear interpolation of the empirical cdf.
    Type 5 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k), où p(k) = (k - 0.5) / n, i.e. piecewise linear function where the knots are the values midway through the steps of the empirical cdf. This is popular amongst hydrologists.
    Type 6 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k) = k / (n + 1), i.e. p(k) = E[F(x[k])]. Utilité par Minitab et SPSS.
    Type 7 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k) = (k - 1) / (n - 1), i.e. p(k) = mode[F(x[k])]. Utilisé par S (et R)
    Type 8 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k) = (k - 1/3) / (n + 1/3), i.e. p(k) =median[F(x[k])], the resulting quantile estimates are approximately median-unbiased regardless of the distribution.
    Type 9 est obtenue par interpolation linéaire entre la kème statistique d’ordre et p(k) = (k - 3/8) / (n + 1/4), i.e. the resulting quantile estimates are approximately unbiased for the expected order statistics if x is normally distributed.

    En faisant des tests sur R, j'ai remarqué qu'excel utilise l'algorithme du quantile de type 7.
    Code R : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    > x<-1:10
    > quantile(x,type=7)
       0%   25%   50%   75%  100% 
     1.00  3.25  5.50  7.75 10.00


    J'aimerais trouver les algorithmes afin d'être capable de faire les calculs pour tous les types.
    En ce qui concerne l'algorithme utilisé par excel, donc de type 7. J'ai pu chopé l'algorithme sur le site de microsoft, donc pour le reproduire, ce n'est pas compliqué.
    Je voudrais en faire de même pour les autres, une idée ?

    Merci

  2. #2
    Rédactrice

    Avatar de stoyak
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    408
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 408
    Points : 1 491
    Points
    1 491
    Par défaut
    Types quantile returns estimates of underlying distribution quantiles based on one or two order statistics from the supplied elements in x at probabilities in probs. One of the nine quantile algorithms discussed in Hyndman and Fan (1996), selected by type, is employed.

    Sample quantiles of type i are defined by

    Q[i](p) = (1 - gamma) x[j] + gamma x[j+1],

    where 1 <= i <= 9, (j-m)/n <= p < (j-m+1)/ n,
    x[j] : jth order statistic
    n is the sample size
    m is a constant determined by the sample quantile type. Here gamma depends on the fractional part of g = np+m-j.

    For the continuous sample quantile types (4 through 9), the sample quantiles can be obtained by linear interpolation between the kth order statistic and p(k):

    p(k) = (k - alpha) / (n - alpha - beta + 1),

    where α and β are constants determined by the type. Further, m = alpha + p(1 - alpha - beta), and gamma = g.

    Discontinuous sample quantile types 1, 2, and 3

    Type 1
    Inverse of empirical distribution function.
    Type 2
    Similar to type 1 but with averaging at discontinuities.
    Type 3
    SAS definition: nearest even order statistic.
    Continuous sample quantile types 4 through 9

    Type 4
    p(k) = k / n. That is, linear interpolation of the empirical cdf.
    Type 5
    p(k) = (k - 0.5) / n. That is a piecewise linear function where the knots are the values midway through the steps of the empirical cdf. This is popular amongst hydrologists.
    Type 6
    p(k) = k / (n + 1). Thus p(k) = E[F(x[k])]. This is used by Minitab and by SPSS.
    Type 7
    p(k) = (k - 1) / (n - 1). In this case, p(k) = mode[F(x[k])]. This is used by S.
    Type 8
    p(k) = (k - 1/3) / (n + 1/3). Then p(k) =~ median[F(x[k])]. The resulting quantile estimates are approximately median-unbiased regardless of the distribution of x.
    Type 9
    p(k) = (k - 3/8) / (n + 1/4). The resulting quantile estimates are approximately unbiased for the expected order statistics if x is normally distributed.
    Hyndman and Fan (1996) recommend type 8. The default method is type 7, as used by S and by R < 2.0.0.
    Author(s)
    Ivan Frohne and Rob J Hyndman.

    Voila la doc du package R .. en espérant que ça te donne quelques pistes!
    Cela demande du courage d'en tirer du plaisir
    Quand on n'a qu'un marteau, tous les problèmes ressemblent à un clou

  3. #3
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut
    Merci stoyak, j'avais regardé cette doc. Mais bon, elle est pas très clair pour moi pour l'instant.

Discussions similaires

  1. calcule des échelant des emplyoés
    Par aminoumania dans le forum Excel
    Réponses: 1
    Dernier message: 04/01/2012, 21h45
  2. Réponses: 12
    Dernier message: 03/01/2012, 13h49
  3. Calcul des rotations des membres
    Par Alec6 dans le forum 3D
    Réponses: 0
    Dernier message: 07/07/2011, 10h02
  4. Calcul des BBOX des dallettes à demander et coordonnées négatives
    Par pscheven dans le forum IGN API Géoportail
    Réponses: 2
    Dernier message: 06/03/2010, 02h03
  5. Réponses: 2
    Dernier message: 17/08/2009, 11h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo