Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS Base
SAS Base Forum d'entraide sur SAS base : étape data, procédures non statistiques, procédures non graphiques, SQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 23/01/2011, 09h57   #1
Invité régulier
 
ben kab
Inscription : octobre 2010
Messages : 54
Détails du profil
Informations personnelles :
Nom : ben kab

Informations forums :
Inscription : octobre 2010
Messages : 54
Points : 9
Points : 9
Par défaut detection des individus hors norme

Bonjour à tous,

Je voudrais savoir s'il y a une méthode pour détecter les individus hors norme ou extrême, et comment les supprimer d'une table.

Merci pour votre aide
demido est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/01/2011, 19h55   #2
Rédacteur
 
Homme Stéphane
Consultant et formateur SAS et Cognos
Inscription : avril 2009
Messages : 1 791
Détails du profil
Informations personnelles :
Nom : Homme Stéphane
Localisation : France, Yvelines (Île de France)

Informations professionnelles :
Activité : Consultant et formateur SAS et Cognos
Secteur : Conseil

Informations forums :
Inscription : avril 2009
Messages : 1 791
Points : 4 012
Points : 4 012
regarde dans la proc UNIVARIATE comment gérer les déciles.
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Moteur de recherche dans les papiers SAS
datametric est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/01/2011, 10h36   #3
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 143
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 143
Points : 1 760
Points : 1 760
Rebonjour Demido,

en quoi ce post est-il différent de celui déjà en cours? J'y ai posté un réponse ce matin qui pourra peut-être t'aider. Evite de multiplier les sujets en tout cas (enfin je veux dire, un sujet, une question...).

@ datametric: si je comprends bien tu considères les individus compris dans les deux déciles les plus extrèmes comme outlier, un supérieur, un inférieur. Si c'est le cas celà revient à dire que nécéssairement un individu sur cinq est extrème. En mon sens, il n'y a pas nécéssairement d'indivdus extrèmes dans un nuage de point, et en tout cas dans peu de cas on arrivera au retrait d'un cinquième des individus...

Je préconise plutot la méthode basée sur l'interquartile range présentée dans l'autre post..
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/01/2011, 10h46   #4
Rédacteur
 
Homme Stéphane
Consultant et formateur SAS et Cognos
Inscription : avril 2009
Messages : 1 791
Détails du profil
Informations personnelles :
Nom : Homme Stéphane
Localisation : France, Yvelines (Île de France)

Informations professionnelles :
Activité : Consultant et formateur SAS et Cognos
Secteur : Conseil

Informations forums :
Inscription : avril 2009
Messages : 1 791
Points : 4 012
Points : 4 012
Sans connaître le fond de la question, je considère que c'est une première étape pour détecter les points aberrants.
Plus particulièrement, je me refère à la table ExtremeObs. (http://support.sas.com/documentation...te_sect058.htm)

Maintenant, rien ne dit que des extrêmes seront détectés ou bien que ces extrêmes soient pertinents dans l'étude.
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Moteur de recherche dans les papiers SAS
datametric est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/01/2011, 11h02   #5
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 143
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 143
Points : 1 760
Points : 1 760
C'est deux approches différentes. Comme tu le suggères, l'essentiel est de se baser sur le cas concret du jeu de données, de son contexte et de sa problématique.

Le retour de demido de ces deux approches sur son jeu de données sera le bienvenu
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/01/2011, 11h09   #6
Rédacteur
 
Homme Stéphane
Consultant et formateur SAS et Cognos
Inscription : avril 2009
Messages : 1 791
Détails du profil
Informations personnelles :
Nom : Homme Stéphane
Localisation : France, Yvelines (Île de France)

Informations professionnelles :
Activité : Consultant et formateur SAS et Cognos
Secteur : Conseil

Informations forums :
Inscription : avril 2009
Messages : 1 791
Points : 4 012
Points : 4 012
C'est clair.
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Moteur de recherche dans les papiers SAS
datametric est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 02h46.


 
 
 
 
Partenaires

Hébergement Web