IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Moyenne conditionnelle par ligne


Sujet :

R

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2009
    Messages
    113
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2009
    Messages : 113
    Points : 107
    Points
    107
    Par défaut Moyenne conditionnelle par ligne
    Bonjour,
    Je souhaite sur chaque ligne d'un dataframe calculer la moyenne d'une colonne VAL, pour toutes les lignes dont les valeurs de comparaison COMP sont comprises dans un intervalle COND_INF - COND_SUP de ma ligne sur laquelle je calcule la moyenne. Il y a donc une moyenne à calculer sur chaque ligne de mon data frame.

    Dans un Dataframe, chaque ligne à 4 colonnes tout le temps renseignées
    COMP = la colonne sur laquelle la condition sera appliquée pour prendre la ligne en compte ou pas dans le calcul de la moyenne
    VAL = la valeur qui sera utilisée pour le calcul de la moyenne si la ligne est prise en compte
    COND_INF = la borne inférieur (-20% de COMP) dont COMP devra être supérieur-égal pour être prise en compte
    COND_SUP = la borne supérieur (+20% de COMP) dont COMP devra être inférieur-égal pour être prise en compte

    J'ai essayé d'expliquer le raisonnement que je souhaite obtenir dans le code ci-dessous.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    df <- data.frame(comp = c(10, 12, 14, 17, 17),
                     val = c(0, 5, 10, 15, 20),
                     cond_inf = c(8, 9.6, 11.2, 13.6, 13.6),
                     cond_sup = c(12, 14.4, 16.8, 20.4, 20.4),
                     mean_cond_text1 = c("Moyenne de VAL des lignes dont COMP est compris entre 8 12", 
                                         "Moyenne de VAL des lignes dont COMP est compris entre 9.6 14.4",
                                         "Moyenne de VAL des lignes dont COMP est compris entre 11.2 16.8",
                                         "Moyenne de VAL des lignes dont COMP est compris entre 13.6 20.4", 
                                         "Moyenne de VAL des lignes dont COMP est compris entre 13.6 20.4"),
                     mean_cond_text2 = c("(val_ligne1+val_ligne2)/2", "(val_ligne1+val_ligne2+val_ligne3)/3", "(val_ligne2+val_ligne3)/2", "(val_ligne3+val_ligne4+val_ligne5)/2", "(val_ligne3+val_ligne4+val_ligne5)/2)"),
                     mean_cond_text3 = c("(0+5)/2", "(0+5+10)/3", "(5+10)/2", "(10+15+20)/3", "(10+15+20)/3)"),
                     mean_cond_num = c((0+5)/2, (0+5+10)/3, (5+10)/2, (10+15+20)/3, (10+15+20)/3))
    Merci de votre aide car je n'y arrive pas du tout.

  2. #2
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    478
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 478
    Points : 832
    Points
    832
    Par défaut
    bonjour,
    vois si ce bout de code correspond à ce que tu veux
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
     
    library(tidyverse)
     
    df <- tibble(comp = c(10, 12, 14, 17, 17),
                     val = c(0, 5, 10, 15, 20),
                     cond_inf = c(8, 9.6, 11.2, 13.6, 13.6),
                     cond_sup = c(12, 14.4, 16.8, 20.4, 20.4))
     
    resultat <- df %>% rowwise() %>% mutate(mean_cond=mean(df$val[df$val>=cond_inf & df$val<=cond_sup]))
    cdlt

  3. #3
    Membre confirmé
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Points : 561
    Points
    561
    Par défaut
    Bonjour,

    Tu as pas mal de façons de faire différentes, avec des boucles des fonctions du type sapply ou encore celles du package dplyr (comme ci-dessus) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    df$mean_cond <- numeric()
    for (i in 1:nrow(df)) {
      df$mean_cond[i] <- mean(df$val[df$comp >= df$cond_inf[i] & df$comp<= df$cond_sup[i]])
    }
     
    # une variante de dplyr avec la fonction between
    df %>% rowwise() %>% mutate(mn = mean(df$val[between(df$comp, cond_inf, cond_sup)]))
     
    # un sapply possible
    sapply(df$comp, function(x) mean(df$val[between(df$comp, x * 0.8, x*1.2)]))
    cdlt

Discussions similaires

  1. [WD17] calcul de moyenne par ligne
    Par stefano dans le forum WinDev
    Réponses: 11
    Dernier message: 28/06/2014, 00h37
  2. [XL-2010] calcul de moyenne par ligne
    Par le_normand dans le forum Excel
    Réponses: 2
    Dernier message: 08/11/2013, 18h46
  3. [CR XI] Moyenne par ligne sur un tableau croisé dynamique sur CR XI
    Par juju05 dans le forum SAP Crystal Reports
    Réponses: 6
    Dernier message: 21/11/2012, 11h46
  4. [AC-2010] Etat : Affichage conditionnel, ligne par ligne
    Par DevBaldwin dans le forum IHM
    Réponses: 5
    Dernier message: 25/10/2011, 20h01
  5. [XL-2010] Mise en forme conditionnelle par ligne
    Par sbricout dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 21/02/2011, 17h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo