Pipeline dplyr ou autre

**marou1991** · 05/02/2019, 16h04

Bonjour,

je cherche à transformer mon bout de code en Pipeline.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
 
#ce que je fais 
 
crm1 <- subset( crm , crm$Brand_Id == 1  & crm$date_id > '2019-01-01')
 
crm1 <- sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                 sum(click) / sum(envoi)  as tx_clic ,
                 sum(click) / sum(ouverture) as tx_reac,
                sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
       from crm1 
       group by deliveryType_id , brand_id' )
 
# j'aimerai avoir un code du style 
 
crm 
%>% filter( brand_id == 1  &  date_id > '2019-01-01' )
%>% sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                 sum(click) / sum(envoi)  as tx_clic ,
                 sum(click) / sum(ouverture) as tx_reac,
                sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
       from crm 
       group by deliveryType_id , brand_id' )

ma table a cette tête :

Brand_Id	date_id	Envoi	Ouverture	desinscription
1	2018-12-14	1	1	0
1	2018-12-28	1	1	0
1	2018-12-16	1	0	1
1	2018-12-10	1	1	0
1	2018-12-08	1	1	0
1	2018-12-20	1	1	0

Merci d'avance.

**tototode** · 06/02/2019, 08h59

Bonjour,

Je pense que c'est possible mais que si tu écrases ton objet de départ :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
crm 
  %<>% filter( brand_id == 1  &  date_id > '2019-01-01' )
  %>% sqldf( ' select sum(ouverture) / sum(envoi) as tx_ouverture, 
                 sum(click) / sum(envoi)  as tx_clic ,
                 sum(click) / sum(ouverture) as tx_reac,
                sum(desinscription)  / sum(ouverture)  as tx_desin , deliveryType_id , brand_id
         from crm 
         group by deliveryType_id , brand_id' )

Après tu peux très bien aussi rajouter une ligne de commande pour dupliquer ton objet initial et n'appliquer ce code que sur l'objet dupliqué.

cdlt

**marou1991** · 07/02/2019, 11h26

Bonjour,

J'ai ce message d'erreur je pense que sqldf ne comprend pas la sortie du filtre en pipeline.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
Error in tcltk::as.tclObj(X) : cannot handle object of mode 'list'

**tototode** · 07/02/2019, 14h16

re,

en fait c'est logique parce que qu'elle que soit l'opérateur que tu utilises il va remplacer le premier argument de ta fonction par la partie gauche de l'opérateur, alors que le premier argument de la fonction sqldf c'est la chaîne de caractère qui correspond à ta requête.
Du coup je ne pense plus que ça soit possible en pipeline ou pas facilement en tout cas. Il te faut faire les choses en séquentiel telles que tu les as faites au départ.

cdlt

Pipeline dplyr ou autre

R

Discussions similaires

Partager

Partager