IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Moyenne élaguée et ou regroupements par classe


Sujet :

R

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2019
    Messages
    88
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 28
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2019
    Messages : 88
    Points : 40
    Points
    40
    Par défaut Moyenne élaguée et ou regroupements par classe
    Bonjour à tous,
    Je travaille par rapport à des codes d'articles qui ont chacun un prix PUHT pour un numéro de commande différent.
    Mon problème est que je dois calculer la moyenne mais seulement en prenant en compte les grandes quantités, par regroupement de prix PUHT par rapport à leur article code. On m'a conseillé soit de faire une moyenne élaguée, ou des regroupements par classe pour vérifier tout d'abord qu'une valeur de Prix PUHT est dans la majorité. Je sais calculer des effectifs et des fréquences mais de manière "lambda", pas pour ce type de problème...
    Si vous pouviez m'aider, d'avance merci
    Voici une partie de mon jeu de données pour exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    preparation
    # A tibble: 76 x 7
       `Article Code` `Article Libellé court`   `N° Commande`    CA  MBGR   Qté  PUHT
                <dbl> <chr>                             <dbl> <dbl> <dbl> <dbl> <dbl>
     1        2001909 MODULE DEPORT BUS X 250M     4014737794   721    66     1   721
     2        2001952 6 ANALOG IN, 4 OUT 8 DIG     4015466742   925   129     1   925
     3        2002586 TSX 3705 CA                  4014253122   436    28     1   436
     4        2003239 COLONNES LUMINEUSES 40 MM    4015900476   397   157     4    99
     5        2005078 CONT 9A 1F 1O 220V BC LPL    4014469083    47    14     1    47
     6        2005307 CONT 115A 4P 230V 50 60HZ    4014179039  1701   170     6   283
     7        2005307 CONT 115A 4P 230V 50 60HZ    4014193057   567    57     2   283
     8        2005307 CONT 115A 4P 230V 50 60HZ    4014244859   297    30     1   297
     9        2005307 CONT 115A 4P 230V 50 60HZ    4014413626   283    23     1   283
    10        2005307 CONT 115A 4P 230V 50 60HZ    4014413736   241    14     1   241
    # ... with 66 more rows

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    L'option trim dans la fonction mean te permettra de calculer des moyennes tronquées. Pour transformer tes prix en tranches avant de calculer des effectifs, vois la fonction cut.
    Bon courage.
    Olivier

  3. #3
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2019
    Messages
    88
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 28
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2019
    Messages : 88
    Points : 40
    Points
    40
    Par défaut
    Citation Envoyé par olivier.decourt Voir le message
    Bonjour.
    L'option trim dans la fonction mean te permettra de calculer des moyennes tronquées. Pour transformer tes prix en tranches avant de calculer des effectifs, vois la fonction cut.
    Merci de m'avoir répondu, j'ai regardé mais en fait il faut choisir soit-même à la louche, ce n'est pas très statistique ?
    J'ai vu ceci :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    vec<-1:10
    out<-cut(vec,breaks=c(0,3,6,10))
    levels(out)<-c("petit","moyen","grand")
    out
    et cela :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    x <- c(0:2, 50)
    mean(x,0.9)
    Je ne vois pas trop comment faire en fait

  4. #4
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Je suis d'accord sur le côté "artisanal" voire "subjectif" des deux méthodes. Cela dit, c'était une réponse stricte à ton interrogation de départ. Si le problème dans les données sont des valeurs extrêmes, il y a plein de manières plus "statistiques" de les restituer : par une médiane, par une boxplot, ...
    Bon courage.
    Olivier

  5. #5
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2019
    Messages
    88
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 28
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2019
    Messages : 88
    Points : 40
    Points
    40
    Par défaut
    Citation Envoyé par olivier.decourt Voir le message
    Je suis d'accord sur le côté "artisanal" voire "subjectif" des deux méthodes. Cela dit, c'était une réponse stricte à ton interrogation de départ. Si le problème dans les données sont des valeurs extrêmes, il y a plein de manières plus "statistiques" de les restituer : par une médiane, par une boxplot, ...
    Bonjour,
    J'avais déjà effectué des boxplots , des médianes mais cela ne convenait pas au directeur qui voulait quelque chose de plus proche de la réalité. J'ai donc demandé à mon prof et c'est lui qui m'a conseillé de faire des moyennes élaguées et un regroupement par classes pour voir le nombre d'effectifs. Le problème dans votre solution c'est que je ne peux pas l'automatiser ou fixer un seuil et le faire pour chaque code article. Et des données j'en ai des milliers voir des millions. Il n'y a vraiment pas un autre moyen de faire, ou alors il faudrait peut être faire de la programmation? Quitte à changer de méthode, je ne sais pas
    En vous remerciant,

Discussions similaires

  1. Moyenne des pentes par classes
    Par Xavier68 dans le forum Méthodes exploratoires
    Réponses: 4
    Dernier message: 26/11/2013, 22h55
  2. Réponses: 2
    Dernier message: 19/10/2012, 13h55
  3. moyenne par classe
    Par shaiHulud dans le forum MATLAB
    Réponses: 1
    Dernier message: 15/10/2012, 14h04
  4. Regroupements par classe d'âge
    Par challe dans le forum SAS Base
    Réponses: 4
    Dernier message: 26/09/2011, 15h16
  5. Regroupement par mois
    Par fplanglois dans le forum SQL
    Réponses: 7
    Dernier message: 29/07/2003, 16h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo