IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Pipeline dplyr ou autre


Sujet :

R

  1. #1
    Membre averti
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Points : 343
    Points
    343
    Par défaut Pipeline dplyr ou autre
    Bonjour,

    je cherche à transformer mon bout de code en Pipeline.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
     
    #ce que je fais 
     
    crm1 <- subset( crm , crm$Brand_Id == 1  & crm$date_id > '2019-01-01')
     
    crm1 <- sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                     sum(click) / sum(envoi)  as tx_clic ,
                     sum(click) / sum(ouverture) as tx_reac,
                    sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
           from crm1 
           group by deliveryType_id , brand_id' )
     
    # j'aimerai avoir un code du style 
     
    crm 
    %>% filter( brand_id == 1  &  date_id > '2019-01-01' )
    %>% sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                     sum(click) / sum(envoi)  as tx_clic ,
                     sum(click) / sum(ouverture) as tx_reac,
                    sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
           from crm 
           group by deliveryType_id , brand_id' )
    ma table a cette tête :

    Brand_Id date_id Envoi Ouverture Click Page_miroir desinscription
    1 2018-12-14 1 1 0 0 0
    1 2018-12-28 1 1 0 0 0
    1 2018-12-16 1 0 0 0 1
    1 2018-12-10 1 1 0 0 0
    1 2018-12-08 1 1 0 0 0
    1 2018-12-20 1 1 0 0 0

    Merci d'avance.

  2. #2
    Membre confirmé
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Points : 561
    Points
    561
    Par défaut
    Bonjour,

    Je pense que c'est possible mais que si tu écrases ton objet de départ :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    crm 
      %<>% filter( brand_id == 1  &  date_id > '2019-01-01' )
      %>% sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                     sum(click) / sum(envoi)  as tx_clic ,
                     sum(click) / sum(ouverture) as tx_reac,
                    sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
             from crm 
             group by deliveryType_id , brand_id' )
    Après tu peux très bien aussi rajouter une ligne de commande pour dupliquer ton objet initial et n'appliquer ce code que sur l'objet dupliqué.

    cdlt

  3. #3
    Membre averti
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Points : 343
    Points
    343
    Par défaut
    Bonjour,

    J'ai ce message d'erreur je pense que sqldf ne comprend pas la sortie du filtre en pipeline.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    Error in tcltk::as.tclObj(X) : cannot handle object of mode 'list'

  4. #4
    Membre confirmé
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Points : 561
    Points
    561
    Par défaut
    re,

    en fait c'est logique parce que qu'elle que soit l'opérateur que tu utilises il va remplacer le premier argument de ta fonction par la partie gauche de l'opérateur, alors que le premier argument de la fonction sqldf c'est la chaîne de caractère qui correspond à ta requête.
    Du coup je ne pense plus que ça soit possible en pipeline ou pas facilement en tout cas. Il te faut faire les choses en séquentiel telles que tu les as faites au départ.

    cdlt

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [langage] Comparer Perl avec d'autres langages comme C ?
    Par Anonymous dans le forum Langage
    Réponses: 3
    Dernier message: 10/08/2002, 23h52
  2. Reprendre une procedure dans une autre ?
    Par Poisson Rouge dans le forum Langage
    Réponses: 3
    Dernier message: 17/07/2002, 22h51
  3. Réponses: 2
    Dernier message: 10/07/2002, 11h51
  4. Réponses: 2
    Dernier message: 21/05/2002, 10h25
  5. Réponses: 3
    Dernier message: 09/05/2002, 01h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo