Bonjour à tous,
Je suis débutant sous XL et souhaiterais demander conseil (comprendre la démarche plus que trouver une réponse toute faite).
Je dois traiter très régulièrement des exports de mon outil de suivi ad-centric et dédupliquer mes contacts en fonction d'une "référence" (identifiant), d'une date et d'une heure.
Jusque là, je traitais toujours à la miminemais la tâche est redondante et c'est une perte de temps quand, j'en suis sûr, il existe des solutions pour automatiser ce travail sous excel (VB).
J'ai simplifié mon fichier de base, il se présente comme suit (4 colonnes) : référence client, format, date de conversion, heure de conversion
Le principe est d'identifier les doublons et de ne conserver, dans chaque doublon, que l'entrée la plus ancienne (ex : 17/03, 21/03, 22/03).
Et donc supprimer les autres.
Maintenant, il peut y avoir un 2 références identiques dans une même journée. Dans ce cas, c'est l'heure qui serait prise en compte.
Dans le fichier test que j'ai joint à ce post, il y a 2 entrées doublonnées :
-> les lignes 2/7 : l'entrée à conserver est donc la ligne 2 car le 17/03 pour les 2 entrées mais "12h05" pour la ligne 2, 17h05 pour la ligne 7
-> les lignes 4/8 : l'entrée à conserver est la ligne 4 car elle date du 05/03 (contre 12/03 pour la ligne 8)
test deduplication multicriteres.xlsx
J'espère avoir été suffisamment explicite dans mon énoncé.
Je vous remercie beaucoup pour la longue lectureet bien entendu pour l'aide que vous pourrez m'apporter !
Bonne journée
G
Partager