Supprimer des doublons (qui ne le sont que partiellement)
Bonjour,
Je me permets de déplacer une discussion que j’avais ouverte initialement dans SAS macro. Je pense que j'aurais plus de chances de trouver une réponse ici :D
Je cherche a lancer une procédure permettant de supprimer l'intégralité d'une ligne si le nom de la ligne i = le nom de la ligne i+1 (la table ayant déja été classée la ligne i est "plus forte" que la ligne i+1).
Voici la table que j'ai :
nom information 1 information 2 information 3 information 4
Dupont x1 23 36 lo
Dupont x1 71 35 lo
Durand w2 21 78 ml
Dumou j3 23 21 xy
Dumou j1 23 21 xy
Et voici la table que j'aimerais obtenir :
nom information 1 information 2 information 3 information 4
Dupont x1 23 36 lo
Durand w2 21 78 ml
Dumou j3 23 21 xy
Je souhaite supprimer les doublons sur la base de leur ordre d'apparition dans la table, car ils ont été triés en amont sur la base de certaines variables. Il faudrait que je lance une procédure qui, dans le cas ou le nom de la ligne i = le nom de la ligne i+1 (comme dans l'exemple les informations pouvant être différentes entre ces deux personnes qui sont en fait une seule et unique personne), alors SAS "jette" la ligne i+1 (même si les informations diffèrent entre ces deux lignes) pour ne garder une table contenant que les lignes i (dans le cas nom i = nom i+1).
Je ne sais pas si je suis totalement clair, n'hésitez pas à me demander des précisions et merci d'avance pour les solutions que vous me proposerez