Bonjour,
J'aimerais pouvoir isoler les doublons dans une table, mais aussi la première occurrence de ces doublons en fonctions d'une clé.
Pour mieux expliquer :
Table d'entrée : TBL1
NUMFYR IDFDOS
aa 123
aa 345
aa 567
bb 246
cc 369
Format de la table voulue en sortie :
NUMFYR IDFDOS
aa 123
aa 345
aa 567
J'ai essayé avec des jointures réflexives ou des requêtes imbriquées,
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10 Proc sql; create table tbl2 as select * from tbl1 t1, (select * from tbl1 group by numfyr having count(*)>1) t2 where t1.numfyr=t2.numfyr; quit;
mais au mieux, j'ai ceci :
NUMFYR IDFDOS
aa 123
aa 123
aa 123
aa 345
aa 345
aa 345
aa 567
aa 567
aa 567
Quelqu'un voit comment s'en sortir ?
A savoir que ma table réelle, fait environ 3M de lignes, et qu'un produit cartésien serait fâcheux^^
Merci d'avance.
Partager