Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS Base
SAS Base Forum d'entraide sur SAS base : étape data, procédures non statistiques, procédures non graphiques, SQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 18/09/2007, 12h00   #1
Invité de passage
 
Inscription : juillet 2007
Messages : 5
Détails du profil
Informations forums :
Inscription : juillet 2007
Messages : 5
Points : 2
Points : 2
Par défaut Identification de doublons

Bonjour,

je rencontre un problème pour identifier des doublons dans une table SAS et je ne parviens pas à trouver la réponse sur le net.

En utilisant :

Code :
1
2
3
proc sort DATA=xxx nodupkey out=yyy;
BY aaa bbb;
run;
je retire tous les doublons sur les variables aaa et bbb de ma table d'origine.

Le problème c'est que je veux faire l'inverse, c'est à dire créer une table ne contenant que les doublons pour les variables que j'ai considérées.

Si je ne suis pas clair demander moi des précisions.

Je vous remercie d'avance pour vos réponses.
jean girolle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/09/2007, 14h08   #2
Responsable SAS
 
Inscription : septembre 2006
Messages : 1 973
Détails du profil
Informations forums :
Inscription : septembre 2006
Messages : 1 973
Points : 4 810
Points : 4 810
Bonjour,
Pour identifier tes doublons tu peux utiliser une proc sql : celle-ci te permettra d'identifier tes doublons que tu pourra ensuite mettre dans une table.
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/11/2007, 16h56   #3
Membre du Club
 
Isabelle
Inscription : novembre 2007
Messages : 44
Détails du profil
Informations personnelles :
Nom : Isabelle
Âge : 34
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : novembre 2007
Messages : 44
Points : 57
Points : 57
Bonjour,

Une nouvelle fonction a été créée avec la V9 de SAS pour obtenir une table avec seulement les doublons :

Code :
1
2
3
4
 
proc sort DATA=TABLE out=out nodupkey DUPOUT=dupocc ;
BY A ;
run ;
La table out contiendra les données sans doublons et la table dupocc que les doublons.
bab22 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/02/2008, 12h44   #4
Membre Expert
 
Inscription : mars 2005
Messages : 1 028
Détails du profil
Informations forums :
Inscription : mars 2005
Messages : 1 028
Points : 1 278
Points : 1 278
Envoyer un message via Yahoo à bahraoui
Citation:
Envoyé par jean girolle Voir le message
Bonjour,

je rencontre un problème pour identifier des doublons dans une table SAS et je ne parviens pas à trouver la réponse sur le net.

En utilisant :

Code :
1
2
3
proc sort DATA=xxx nodupkey out=yyy;
BY aaa bbb;
run;
je retire tous les doublons sur les variables aaa et bbb de ma table d'origine.

Le problème c'est que je veux faire l'inverse, c'est à dire créer une table ne contenant que les doublons pour les variables que j'ai considérées.

Si je ne suis pas clair demander moi des précisions.

Je vous remercie d'avance pour vos réponses.

Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
proc sql;
CREATE TABLE toto AS
SELECT aaa, bbb, count(*) AS nb_db
FROM xxx 
GROUP BY aaa,bbb
HAVING count (*) >1;
quit;
dans la TABLE toto ON a tous les valeurs doublons
proc sql;
CREATE TABLE tot_doub AS
SELECT b.*
FROM toto a, xxx b
WHERE a.aaa=b.aaa
AND b.bbb=b.bbb;
quit;
la table tot_doub ne contient que les doublons.
bahraoui est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 23h44.


 
 
 
 
Partenaires

Hébergement Web