IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Par défaut dupliquer des observation (lignes) si date manquante (en remplaçant une colonne par 0 pour les nouvelles ligne
    Bonjour les amis,

    J'espère que tout le monde se porte bien.

    J'ai un problème que je souhaite résoudre pour finaliser la construction de la base de donnée de mon mémoire de maîtrise.

    Je vous explique ce que j'essai de faire car le titre n'est pas assez claire :

    Voici à quoi ressemble une partie de ma base de données actuelle pour un usager(ID) ayant consommé pendant les 18 périodes (de avril 2015 à septembre 2016) :


    Nom : EX1.PNG
Affichages : 737
Taille : 29,6 Ko


    Maintenant, il se peut que j'ai des usagers dans ma base de données qui n'ont pas consommés dans certains mois pour les 18 périodes. Donc il n'y aura pas d'observations (lignes) pour ces mois.
    Dans l'exemple ci-dessous, l'usager YYY n'a pas consommer pendant 3 périodes ( le mois d'avril 2015, le mois juin 2015 et le mois juin 2016 ) :


    Nom : EX2.PNG
Affichages : 678
Taille : 27,0 Ko


    Ce que j'aimerais faire pour cet usager qui n'a pas consommé pendant ces 3 périodes, c'est de dupliquer ces informations avec les trois nouvelles dates et mettre sa consommation à 0 (voir en image ce que je veux faire) :


    Nom : EX3.PNG
Affichages : 668
Taille : 30,8 Ko

    J'ai la consommation de près de 50 000 usagers et je ne sais pas comment faire cela au plus vite pour tous ceux qui n'ont pas eu de consommation.
    Je devrais avoir pour chaque usagers 18 lignes.

    Surtout que je suis débutant en R.

    Merci d'avance pour votre aide.

  2. #2
    Membre émérite
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    491
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 491
    Par défaut
    bonjour ,essaye si il n'y a pas de bugs

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    ## j'ai nommé ton tableau de données df1
    ##periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01',...))# dataframe contenant tes 18 périodes
     
    ajouter <- function(id,df,periodes){
      df_id <- df %>% filter(iu_usager == id)  ## filtre avec identitiant
      autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct() ## selection des valeurs des autres colonnes pour ajout ultérieur
      periodes_manquantes <- periodes %>% anti_join(df_id ,by= c('periode' = "date" ) ) ## on sélectionne les dates manquantes
       ajout <- map_df(periodes_manquantes,~(tibble(iu_usager = id,date = .x,cons_heure_mois = 0) %>% bind_cols(autres_colonnes))) ## on crée les lignes à ajouter
     
       df_id %>% bind_rows(ajout) ## on les rajoute au lignes déjà existantes
     
    }
     
    df2 <- map_df(unique(df1$iu_usager),ajouter,df = df1 ,periodes =periodes) ## creation du fichier demandé
    cdlt

  3. #3
    Membre confirmé
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Par défaut merci
    Merci beaucoup xavier-Pierre,

    J'ai essayé ton code.

    J'ai eu cette première erreur :

    Nom : erreur1.PNG
Affichages : 656
Taille : 29,7 Ko

    Ensuite j'ai eu le réflexe de vérifier la classe de la colonne periode de la dataframe contenant les 18 périodes.
    Elle était de type "character". J'ai donne changé pour "Date".

    Code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
     
    ## j'ai nommé ton tableau de données df1
    periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01','2015-07-01','2015-08-01','2015-09-01',
                                   '2015-10-01','2015-11-01','2015-12-01','2016-01-01','2016-02-01','2016-03-01',
                                   '2016-04-01','2016-05-01','2016-06-01','2016-07-01','2016-08-01','2016-09-01'))# dataframe contenant tes 18 périodes
     
     
     
    class (periodes$periode)
    periodes$periode = as.Date(periodes$periode,format="%Y-%m-%d")
    class (periodes$periode)

    J'ai ensuite essayer à nouveau le code. Mais j'ai cette nouvelle erreur :


    Nom : erreur2.PNG
Affichages : 680
Taille : 58,7 Ko



    Je t'ajoute tous le code modifier et j'essai de voir c'est quoi le problème.


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
     
    df1 = CONSO_AVANT_TRAITEMENT
     
    ## j'ai nommé ton tableau de données df1
    periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01','2015-07-01','2015-08-01','2015-09-01',
                                   '2015-10-01','2015-11-01','2015-12-01','2016-01-01','2016-02-01','2016-03-01',
                                   '2016-04-01','2016-05-01','2016-06-01','2016-07-01','2016-08-01','2016-09-01'))# dataframe contenant tes 18 périodes
     
     
    class (periodes$periode)
    periodes$periode = as.Date(periodes$periode,format="%Y-%m-%d")
    class (periodes$periode)
     
     
    ajouter <- function(id,df,periodes){
      df_id <- df %>% filter(IU_USAGER == id)  ## filtre avec identitiant
      autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct() ## selection des valeurs des autres colonnes pour ajout ultérieur
      periodes_manquantes <- periodes %>% anti_join(df_id ,by= c('periode' = "date" ) ) ## on sélectionne les dates manquantes
      ajout <- map_df(periodes_manquantes,~(tibble(IU_USAGER = id,date = .x,CONS_HEURES_MOIS = 0) %>% bind_cols(autres_colonnes))) ## on crée les lignes à ajouter
     
      df_id %>% bind_rows(ajout) ## on les rajoute au lignes déjà existantes
     
    }
     
     
    df2 <- map_df(unique(df1$IU_USAGER),ajouter,df = df1 ,periodes = periodes) ## creation du fichier demandé

    Pour ton information au cas ou cela impact ton code, ma base de données contient au total 21 colonne (y compris l'ID de l'usager).

    Merci beaucoup Pierre!

  4. #4
    Membre émérite
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    491
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 491
    Par défaut
    tu peux envoyer ton fichier ou 1 extrait?

  5. #5
    Membre confirmé
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Par défaut merci
    Allo Pierre,

    Une copie de la base de données ??

    Ci-joint un fichier avec l'usager qui n'a pas consommer pensant les trois périodes.
    Vu que les info sont très confidentiel, j'ai inventer certaines information, mais la structure de la base de donnée reste inchangée.

    Est-ce que c'est correct ?
    Fichiers attachés Fichiers attachés

  6. #6
    Membre émérite
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    491
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 491
    Par défaut
    ok j'ai compris
    dans la fonction ajouter le probleme est au niveau de l'instruction
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct()
    j'avais considéré que toutes les autres colonnes avais des valeurs identiques pour un identifiant, mais ce n'est pas le cas , les valeurs des colonnes Date_naissance et Periode sont différentes,
    donc il te faut définir des régles de remplacements pour ces 2 colonnes

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2013] Créer une alerte par mail pour des dates expirées
    Par RemiEJ dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 16/07/2019, 14h27
  2. Réponses: 6
    Dernier message: 15/01/2016, 15h05
  3. Réponses: 3
    Dernier message: 26/07/2006, 14h58
  4. Trier une colonne par date
    Par foobar42 dans le forum Macros et VBA Excel
    Réponses: 6
    Dernier message: 11/07/2006, 17h46
  5. Réponses: 20
    Dernier message: 19/12/2004, 18h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo