IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Création variable doublons par client avec périodicité


Sujet :

R

  1. #1
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Novembre 2021
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2021
    Messages : 2
    Points : 3
    Points
    3
    Par défaut Création variable doublons par client avec périodicité
    Bonjour,

    Je dispose d'un dataframe df contenant la liste des appels de mes clients.
    J'aimerais grâce à ce dataframe identifier si les clients m'ont appelé plusieurs fois sur une période définie : 7 jours avant et 7 jours après, pour un même sujet.

    Voici mes données initiales :

    id_client id_appel sujet date
    4 40 B 04/10/2021
    4 41 B 05/10/2021
    3 30 B 05/10/2021
    2 20 A 12/10/2021
    5 50 C 13/10/2021
    5 51 A 14/10/2021
    1 10 A 20/10/2021
    1 11 A 29/10/2021

    Au final je souhaite indiquer si l'appel est un doublon (si c'est le cas identifier le 1er appel en tant que FIRST, les autres en doublons) ou s'il est unique.
    J'aimerai si possible quelque chose comme ça :

    id_client id_appel sujet date new_var
    4 40 B 04/10/2021 FIRST
    4 41 B 05/10/2021 DOUBLON
    3 30 B 05/10/2021 UNIQUE
    2 20 A 12/10/2021 UNIQUE
    5 50 C 13/10/2021 UNIQUE
    5 51 A 14/10/2021 UNIQUE
    1 10 A 20/10/2021 UNIQUE
    1 11 A 29/10/2021 UNIQUE

    J'espère que mes explications sont assez claires, merci d'avance pour les retours qu'il pourrait y avoir sur le sujet !

    Bien cordialement

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    Ce genre de problème se gère relativement bien avec {dplyr}, j'espère que c'est une syntaxe qui t'est familière.
    L'idée générale est déjà de suivre les étapes suivantes :
    • trier les données par client, sujet et date d'appel
    • faire des blocs (group_by) par client et sujet
    • calculer l'écart entre la date d'appel et la précédente, et aussi l'écart entre la date d'appel et la suivante (fonctions lag et lead)
    • selon les résultats, définir la valeur de NEW_VAR avec une formule conditionnelle type case_when

    Si tu bloques sur des problèmes de code spécifiques on sera ravis de t'aider.
    Bon courage.
    Olivier

Discussions similaires

  1. Réponses: 1
    Dernier message: 14/12/2017, 12h58
  2. Réponses: 2
    Dernier message: 08/08/2013, 11h07
  3. Requête par client avec ventilation par mois
    Par eclisse dans le forum MS SQL Server
    Réponses: 8
    Dernier message: 10/01/2013, 17h08
  4. Encodage par client avec Mina
    Par Koudou dans le forum Entrée/Sortie
    Réponses: 1
    Dernier message: 12/11/2012, 11h02
  5. [Drupal] Création d'un Espace client avec Drupal-6.19
    Par napster007 dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 3
    Dernier message: 25/03/2011, 16h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo