Moyenne élaguée et ou regroupements par classe

**Statistiques33** · 12/06/2019, 15h39

Bonjour à tous,
Je travaille par rapport à des codes d'articles qui ont chacun un prix PUHT pour un numéro de commande différent.
Mon problème est que je dois calculer la moyenne mais seulement en prenant en compte les grandes quantités, par regroupement de prix PUHT par rapport à leur article code. On m'a conseillé soit de faire une moyenne élaguée, ou des regroupements par classe pour vérifier tout d'abord qu'une valeur de Prix PUHT est dans la majorité. Je sais calculer des effectifs et des fréquences mais de manière "lambda", pas pour ce type de problème...
Si vous pouviez m'aider, d'avance merci
Voici une partie de mon jeu de données pour exemple :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
preparation
# A tibble: 76 x 7
   `Article Code` `Article Libellé court`   `N° Commande`    CA  MBGR   Qté  PUHT
            <dbl> <chr>                             <dbl> <dbl> <dbl> <dbl> <dbl>
 1        2001909 MODULE DEPORT BUS X 250M     4014737794   721    66     1   721
 2        2001952 6 ANALOG IN, 4 OUT 8 DIG     4015466742   925   129     1   925
 3        2002586 TSX 3705 CA                  4014253122   436    28     1   436
 4        2003239 COLONNES LUMINEUSES 40 MM    4015900476   397   157     4    99
 5        2005078 CONT 9A 1F 1O 220V BC LPL    4014469083    47    14     1    47
 6        2005307 CONT 115A 4P 230V 50 60HZ    4014179039  1701   170     6   283
 7        2005307 CONT 115A 4P 230V 50 60HZ    4014193057   567    57     2   283
 8        2005307 CONT 115A 4P 230V 50 60HZ    4014244859   297    30     1   297
 9        2005307 CONT 115A 4P 230V 50 60HZ    4014413626   283    23     1   283
10        2005307 CONT 115A 4P 230V 50 60HZ    4014413736   241    14     1   241
# ... with 66 more rows

**olivier.decourt** · 12/06/2019, 16h10

Bonjour.
L'option trim dans la fonction mean te permettra de calculer des moyennes tronquées. Pour transformer tes prix en tranches avant de calculer des effectifs, vois la fonction cut.

**Statistiques33** · 12/06/2019, 16h19

Envoyé par olivier.decourt

Bonjour.
L'option trim dans la fonction mean te permettra de calculer des moyennes tronquées. Pour transformer tes prix en tranches avant de calculer des effectifs, vois la fonction cut.

Merci de m'avoir répondu, j'ai regardé mais en fait il faut choisir soit-même à la louche, ce n'est pas très statistique ?
J'ai vu ceci :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
vec<-1:10
out<-cut(vec,breaks=c(0,3,6,10))
levels(out)<-c("petit","moyen","grand")
out

et cela :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
x <- c(0:2, 50)
mean(x,0.9)

Je ne vois pas trop comment faire en fait

**olivier.decourt** · 12/06/2019, 19h25

Je suis d'accord sur le côté "artisanal" voire "subjectif" des deux méthodes. Cela dit, c'était une réponse stricte à ton interrogation de départ. Si le problème dans les données sont des valeurs extrêmes, il y a plein de manières plus "statistiques" de les restituer : par une médiane, par une boxplot, ...

**Statistiques33** · 13/06/2019, 08h31

Envoyé par olivier.decourt

Je suis d'accord sur le côté "artisanal" voire "subjectif" des deux méthodes. Cela dit, c'était une réponse stricte à ton interrogation de départ. Si le problème dans les données sont des valeurs extrêmes, il y a plein de manières plus "statistiques" de les restituer : par une médiane, par une boxplot, ...

Bonjour,
J'avais déjà effectué des boxplots , des médianes mais cela ne convenait pas au directeur qui voulait quelque chose de plus proche de la réalité. J'ai donc demandé à mon prof et c'est lui qui m'a conseillé de faire des moyennes élaguées et un regroupement par classes pour voir le nombre d'effectifs. Le problème dans votre solution c'est que je ne peux pas l'automatiser ou fixer un seuil et le faire pour chaque code article. Et des données j'en ai des milliers voir des millions. Il n'y a vraiment pas un autre moyen de faire, ou alors il faudrait peut être faire de la programmation? Quitte à changer de méthode, je ne sais pas
En vous remerciant,

Moyenne élaguée et ou regroupements par classe

R

Discussions similaires

Partager

Partager