IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut dupliquer des observation (lignes) si date manquante (en remplaçant une colonne par 0 pour les nouvelles ligne
    Bonjour les amis,

    J'espère que tout le monde se porte bien.

    J'ai un problème que je souhaite résoudre pour finaliser la construction de la base de donnée de mon mémoire de maîtrise.

    Je vous explique ce que j'essai de faire car le titre n'est pas assez claire :

    Voici à quoi ressemble une partie de ma base de données actuelle pour un usager(ID) ayant consommé pendant les 18 périodes (de avril 2015 à septembre 2016) :


    Nom : EX1.PNG
Affichages : 623
Taille : 29,6 Ko


    Maintenant, il se peut que j'ai des usagers dans ma base de données qui n'ont pas consommés dans certains mois pour les 18 périodes. Donc il n'y aura pas d'observations (lignes) pour ces mois.
    Dans l'exemple ci-dessous, l'usager YYY n'a pas consommer pendant 3 périodes ( le mois d'avril 2015, le mois juin 2015 et le mois juin 2016 ) :


    Nom : EX2.PNG
Affichages : 581
Taille : 27,0 Ko


    Ce que j'aimerais faire pour cet usager qui n'a pas consommé pendant ces 3 périodes, c'est de dupliquer ces informations avec les trois nouvelles dates et mettre sa consommation à 0 (voir en image ce que je veux faire) :


    Nom : EX3.PNG
Affichages : 573
Taille : 30,8 Ko

    J'ai la consommation de près de 50 000 usagers et je ne sais pas comment faire cela au plus vite pour tous ceux qui n'ont pas eu de consommation.
    Je devrais avoir pour chaque usagers 18 lignes.

    Surtout que je suis débutant en R.

    Merci d'avance pour votre aide.

  2. #2
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    bonjour ,essaye si il n'y a pas de bugs

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    ## j'ai nommé ton tableau de données df1
    ##periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01',...))# dataframe contenant tes 18 périodes
     
    ajouter <- function(id,df,periodes){
      df_id <- df %>% filter(iu_usager == id)  ## filtre avec identitiant
      autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct() ## selection des valeurs des autres colonnes pour ajout ultérieur
      periodes_manquantes <- periodes %>% anti_join(df_id ,by= c('periode' = "date" ) ) ## on sélectionne les dates manquantes
       ajout <- map_df(periodes_manquantes,~(tibble(iu_usager = id,date = .x,cons_heure_mois = 0) %>% bind_cols(autres_colonnes))) ## on crée les lignes à ajouter
     
       df_id %>% bind_rows(ajout) ## on les rajoute au lignes déjà existantes
     
    }
     
    df2 <- map_df(unique(df1$iu_usager),ajouter,df = df1 ,periodes =periodes) ## creation du fichier demandé
    cdlt

  3. #3
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    Merci beaucoup xavier-Pierre,

    J'ai essayé ton code.

    J'ai eu cette première erreur :

    Nom : erreur1.PNG
Affichages : 549
Taille : 29,7 Ko

    Ensuite j'ai eu le réflexe de vérifier la classe de la colonne periode de la dataframe contenant les 18 périodes.
    Elle était de type "character". J'ai donne changé pour "Date".

    Code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
     
    ## j'ai nommé ton tableau de données df1
    periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01','2015-07-01','2015-08-01','2015-09-01',
                                   '2015-10-01','2015-11-01','2015-12-01','2016-01-01','2016-02-01','2016-03-01',
                                   '2016-04-01','2016-05-01','2016-06-01','2016-07-01','2016-08-01','2016-09-01'))# dataframe contenant tes 18 périodes
     
     
     
    class (periodes$periode)
    periodes$periode = as.Date(periodes$periode,format="%Y-%m-%d")
    class (periodes$periode)

    J'ai ensuite essayer à nouveau le code. Mais j'ai cette nouvelle erreur :


    Nom : erreur2.PNG
Affichages : 544
Taille : 58,7 Ko



    Je t'ajoute tous le code modifier et j'essai de voir c'est quoi le problème.


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
     
    df1 = CONSO_AVANT_TRAITEMENT
     
    ## j'ai nommé ton tableau de données df1
    periodes <- tibble(periode = c('2015-04-01','2015-05-01','2015-06-01','2015-07-01','2015-08-01','2015-09-01',
                                   '2015-10-01','2015-11-01','2015-12-01','2016-01-01','2016-02-01','2016-03-01',
                                   '2016-04-01','2016-05-01','2016-06-01','2016-07-01','2016-08-01','2016-09-01'))# dataframe contenant tes 18 périodes
     
     
    class (periodes$periode)
    periodes$periode = as.Date(periodes$periode,format="%Y-%m-%d")
    class (periodes$periode)
     
     
    ajouter <- function(id,df,periodes){
      df_id <- df %>% filter(IU_USAGER == id)  ## filtre avec identitiant
      autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct() ## selection des valeurs des autres colonnes pour ajout ultérieur
      periodes_manquantes <- periodes %>% anti_join(df_id ,by= c('periode' = "date" ) ) ## on sélectionne les dates manquantes
      ajout <- map_df(periodes_manquantes,~(tibble(IU_USAGER = id,date = .x,CONS_HEURES_MOIS = 0) %>% bind_cols(autres_colonnes))) ## on crée les lignes à ajouter
     
      df_id %>% bind_rows(ajout) ## on les rajoute au lignes déjà existantes
     
    }
     
     
    df2 <- map_df(unique(df1$IU_USAGER),ajouter,df = df1 ,periodes = periodes) ## creation du fichier demandé

    Pour ton information au cas ou cela impact ton code, ma base de données contient au total 21 colonne (y compris l'ID de l'usager).

    Merci beaucoup Pierre!

  4. #4
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    tu peux envoyer ton fichier ou 1 extrait?

  5. #5
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    Allo Pierre,

    Une copie de la base de données ??

    Ci-joint un fichier avec l'usager qui n'a pas consommer pensant les trois périodes.
    Vu que les info sont très confidentiel, j'ai inventer certaines information, mais la structure de la base de donnée reste inchangée.

    Est-ce que c'est correct ?
    Fichiers attachés Fichiers attachés

  6. #6
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    ok j'ai compris
    dans la fonction ajouter le probleme est au niveau de l'instruction
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    autres_colonnes <- df %>% select(-1,-2,-3)%>% distinct()
    j'avais considéré que toutes les autres colonnes avais des valeurs identiques pour un identifiant, mais ce n'est pas le cas , les valeurs des colonnes Date_naissance et Periode sont différentes,
    donc il te faut définir des régles de remplacements pour ces 2 colonnes

  7. #7
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut
    On peut ne pas considerer ces colonnes.
    Je vais les supprimer avant d'appliquer ta fonction ?

    Je vais les ajouter après avoir construire la base de données, à la toute fin!

    Peux-tu m'aider à y arriver juste sans ces colonnes que tu considères problématique.

    Merci !

  8. #8
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    Allo,

    J'ai mal compris ton message.

    En fait la date de naissance est identique pour un usager.
    Je n'ai pas fait attention quand j'ai modifier la date de naissance et copier.

    Nom : Capture.PNG
Affichages : 555
Taille : 47,6 Ko

    Mais comme j'ai dit, tu peux te passer de la date de naissance et de la colonne période.
    Je vais l'ai ajouter après l'application de ton code.


    Merci beaucoup !

  9. #9
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    donc si la date de naissance est identique et que tu supprime la colonne periode avant l'execution de la fonction , cela devrait être bon

  10. #10
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    J'ai supprimer la colonne "Periode" dans ma BD avant, mais j'ai toujours la même erreur.

    J'ai même supprimer la date de naissance aussi mais pareil.


    Nom : Capture.PNG
Affichages : 536
Taille : 9,3 Ko

  11. #11
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    dans la fonction ajouter mets en première instruction print(id), relance le script et regarde les lignes qui correspondent à l'identifiant où il y a l'erreur voir si toutes les valeurs des colonnes soient identiques

  12. #12
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    ok j'a i trouvé j'avais faits 2 erreurs
    voici la fonction ajouter corrigée (enfin je l'espère...)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    ajouter <- function(id,df,periodes){
      df_id <- df %>% filter(IU_USAGER == id) 
      autres_colonnes <- df_id %>% select(-1,-2,-3)%>% distinct()
      periodes_manquantes <- periodes %>% anti_join(df_id ,by= c('periode' = "date" ) )
       ajout <- map_df(periodes_manquantes$periode,~tibble(IU_USAGER = id,date = .x,CONS_HEURES_MOIS =0) %>% bind_cols(autres_colonnes)) 
      
       df_id %>% bind_rows(ajout)
      
    }
    cldt

  13. #13
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    Je croise les doigts.

    Je te reviens tantôt !

  14. #14
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci
    Allo Pierre,

    Je viens d'exécuter, ça fait 20 min ça tourne.
    J'attend le résultat.

    Au moins cette fois je n'ai pas eu de message d'erreur.
    Je t'écris dès que j'ai le résultat

  15. #15
    Membre du Club
    Homme Profil pro
    Économiste
    Inscrit en
    Janvier 2016
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : Canada

    Informations professionnelles :
    Activité : Économiste

    Informations forums :
    Inscription : Janvier 2016
    Messages : 114
    Points : 44
    Points
    44
    Par défaut merci infiniment
    NICKELLLLL

    Ça à l'ère de fonctionner.

    Nom : Capture.PNG
Affichages : 532
Taille : 38,7 Ko


    Je fais quelques vérifications....

    Mais je mets déjà résolu.


    MERCI POUR TOUT PIERRE !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2013] Créer une alerte par mail pour des dates expirées
    Par RemiEJ dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 16/07/2019, 14h27
  2. Réponses: 6
    Dernier message: 15/01/2016, 15h05
  3. Réponses: 3
    Dernier message: 26/07/2006, 14h58
  4. Trier une colonne par date
    Par foobar42 dans le forum Macros et VBA Excel
    Réponses: 6
    Dernier message: 11/07/2006, 17h46
  5. Réponses: 20
    Dernier message: 19/12/2004, 18h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo