Bonjour,

J'aimerais pouvoir isoler les doublons dans une table, mais aussi la première occurrence de ces doublons en fonctions d'une clé.

Pour mieux expliquer :


Table d'entrée : TBL1

NUMFYR IDFDOS

aa 123
aa 345
aa 567
bb 246
cc 369


Format de la table voulue en sortie :

NUMFYR IDFDOS

aa 123
aa 345
aa 567


J'ai essayé avec des jointures réflexives ou des requêtes imbriquées,

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
Proc sql;
create table tbl2 as
select *
from tbl1 t1,
(select * 
from tbl1
group by numfyr
having count(*)>1) t2
where t1.numfyr=t2.numfyr;
quit;

mais au mieux, j'ai ceci :

NUMFYR IDFDOS

aa 123
aa 123
aa 123
aa 345
aa 345
aa 345
aa 567
aa 567
aa 567


Quelqu'un voit comment s'en sortir ?

A savoir que ma table réelle, fait environ 3M de lignes, et qu'un produit cartésien serait fâcheux^^

Merci d'avance.