Identification variables en double
Bonjour à tous,
En ce moment je travaille sur l'automatisation d'un cleaning d'une feuille excel sur R. J'ai réussi à faire tout ce que je voulais sauf deux points, j'aimerais donc que l'on m'oriente sur la démarche ou la manière de penser le script.
Dataframe : 5 colonnes : Code_client_acheteurs, Code_client_livraison, code_contrat, Date_contrat, Date_facture.
Code_client_acheteurs = client qui paye
Code_client_livraison = client qui est livrée
1er problème : J'ai besoin de supprimer les lignes si : 1 Code_client_livraison est égale à plus d'un Code_client_acheteurs (en gardant le contrat le plus récent ).
logique : ce n'est pas normal qu'un livrée à deux payeurs..
Voilà je n'ai aucune idée sur la manière de faire... je suis désespérée...
2eme problème : J'ai besoin de supprimer les lignes si 1 Code_client_acheteurs est égale à plus de 1 Code_client_livraison si sa facture à plus de 5 ans.
logique : c'est un client alors dit inactifs
Je me doute que lorsque l'un sera résolu, je vais facilement résoudre le deuxième car c'est le même résonnement mais comment identifier le "si un variable égale 2 fois la deuxième variable).
Je ne veux pas forcement que l'on me donne une réponse mais j'aimerais être orienté pour éviter de devoir faire ce travail à la main... ( le cas 1 apparaît en moyenne 700 fois d'après un tb dynamique sur excel... et je voudrais tout avoir sur R car mon "traitement" n'est pas terminé)
Merci d'avance