Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 18/11/2010, 16h53   #1
Invité de passage
 
letef aurelie
Inscription : novembre 2010
Messages : 14
Détails du profil
Informations personnelles :
Nom : letef aurelie

Informations forums :
Inscription : novembre 2010
Messages : 14
Points : 4
Points : 4
Par défaut MACRO pour générer échantillon bootstrap

Bonjour,

Voilà une macro permettant d'effectuer un échantillon bootstrap ("out") à partir d'un jeu de données ("in").
J'ai trouvé cette macro (qui fonctionne très bien) sur :
http://www.math.univ-toulouse.fr/~be...s/tp6ssbvc.pdf

Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
 
/* Macro générant des échantillons bootstrap */
 
%macro bootstrp(IN,out);
DATA seed (keep=seed) &out (DROP=seed i);
IF _n_=1 then SET seed;
do i=1 TO ntot;
  call ranuni(seed,num);
  num=floor(ntot*num+1);
  SET &IN point=num nobs=ntot;
  output &out;
end;
output seed;
stop;
run;
%mend;
 
DATA seed;
retain seed 13;
run;

Malheureusement, étant novice en la matière , j'ai quelques difficultés à comprendre :
- à quoi correspond "seed" qu'on appelle la graine.
-pourquoi la graine est égale à 13 et et quelle valeur choisir?
data seed;
retain seed 13;
run;
- d'où vient la variable point dans "set &in point=num nobs=ntot;"
- pourquoi faire un "stop;"

Merci d'avance pour vos réponses.
glaconutella est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/11/2010, 18h32   #2
Membre actif
 
Inscription : mars 2003
Messages : 149
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 149
Points : 162
Points : 162
Salut Glaconutella,

Le seed permet de générer tes nombre (pseudo) aléatoires.
En choisissant un seed fixe, tu auras les mêmes résultats entre 2 exécutions de ton programme.
je te conseille de prendre une autre valeur (Ex le nombre de secondes écoulés depuis le 1/1/2010) pour éviter cet effet. Ainsi 2 exécutions de ton programme ne donnera pas les mêmes résultats.


Le point et le stop vont ensemble. Le point permet l'accession directe à la num ème observation (dixit ton programme)

Stop permet de quitter l'étape data. sinon, il boucle sans cesse sur la num ème observation.

Ces instructions sont plus performantes que un where=(_n_=num)
la2002 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/11/2010, 22h03   #3
Rédacteur
 
Homme Stéphane
Consultant et formateur SAS et Cognos
Inscription : avril 2009
Messages : 1 791
Détails du profil
Informations personnelles :
Nom : Homme Stéphane
Localisation : France, Yvelines (Île de France)

Informations professionnelles :
Activité : Consultant et formateur SAS et Cognos
Secteur : Conseil

Informations forums :
Inscription : avril 2009
Messages : 1 791
Points : 4 012
Points : 4 012
vas voir la proc surveyselect qui fait du bootstrap toute seule avec REPS=
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Moteur de recherche dans les papiers SAS
datametric est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/11/2010, 09h05   #4
Membre éprouvé
 
Homme Rémi Bousquet
responsable adjoint service stat
Inscription : mars 2009
Messages : 334
Détails du profil
Informations personnelles :
Nom : Homme Rémi Bousquet
Âge : 35
Localisation : France

Informations professionnelles :
Activité : responsable adjoint service stat
Secteur : Finance

Informations forums :
Inscription : mars 2009
Messages : 334
Points : 464
Points : 464
Tu peux trouver plein d'infos et de programmes sur le site d'Olivier DECOURT
http://www.od-datamining.com/
RemiBousquet est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/11/2010, 14h20   #5
Rédacteur
 
Homme Stéphane
Consultant et formateur SAS et Cognos
Inscription : avril 2009
Messages : 1 791
Détails du profil
Informations personnelles :
Nom : Homme Stéphane
Localisation : France, Yvelines (Île de France)

Informations professionnelles :
Activité : Consultant et formateur SAS et Cognos
Secteur : Conseil

Informations forums :
Inscription : avril 2009
Messages : 1 791
Points : 4 012
Points : 4 012
J'en avais parlé avec Olivier cet été et nous avions conclu que REPS= était la meilleur stratégie pour le bootstrap
__________________
N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Moteur de recherche dans les papiers SAS
datametric est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 08h55.


 
 
 
 
Partenaires

Hébergement Web