Création variable doublons par client avec périodicité
Bonjour,
Je dispose d'un dataframe df contenant la liste des appels de mes clients.
J'aimerais grâce à ce dataframe identifier si les clients m'ont appelé plusieurs fois sur une période définie : 7 jours avant et 7 jours après, pour un même sujet.
Voici mes données initiales :
id_client |
id_appel |
sujet |
date |
4 |
40 |
B |
04/10/2021 |
4 |
41 |
B |
05/10/2021 |
3 |
30 |
B |
05/10/2021 |
2 |
20 |
A |
12/10/2021 |
5 |
50 |
C |
13/10/2021 |
5 |
51 |
A |
14/10/2021 |
1 |
10 |
A |
20/10/2021 |
1 |
11 |
A |
29/10/2021 |
Au final je souhaite indiquer si l'appel est un doublon (si c'est le cas identifier le 1er appel en tant que FIRST, les autres en doublons) ou s'il est unique.
J'aimerai si possible quelque chose comme ça :
id_client |
id_appel |
sujet |
date |
new_var |
4 |
40 |
B |
04/10/2021 |
FIRST |
4 |
41 |
B |
05/10/2021 |
DOUBLON |
3 |
30 |
B |
05/10/2021 |
UNIQUE |
2 |
20 |
A |
12/10/2021 |
UNIQUE |
5 |
50 |
C |
13/10/2021 |
UNIQUE |
5 |
51 |
A |
14/10/2021 |
UNIQUE |
1 |
10 |
A |
20/10/2021 |
UNIQUE |
1 |
11 |
A |
29/10/2021 |
UNIQUE |
J'espère que mes explications sont assez claires, merci d'avance pour les retours qu'il pourrait y avoir sur le sujet !
Bien cordialement