|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Inscription : juillet 2009 Messages : 11 ![]() |
Bonjour,
J'ai utilisé un échantillonnage stratifié avec la proc SurveySelect, l’échantillon représente 70% du fichier mère, mais je ne sais pas comment retrouver les 30% non sélectionnés, car j'aimerais l'utiliser comme échantillon de validation. Est ce qu'il y a une option dans proc Surveyselect pour faire ça? ou il faut procéder autrement (déduire les 70% des 100% pour retrouver les 30%, par exemple)? |
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
Salut,
Quel est le modèle tu utilises pour modéliser? Je sais que la proc logistic gère ce type de problème (estimation des betas sur un échantillon de test et validation sur les 30% restants) |
|
|
00
|
|
|
#3 |
|
Invité de passage
![]() Inscription : juillet 2009 Messages : 11 ![]() |
Je veux utiliser, entre autres, la proc logistic pour estimer mon modèle. mais aussi la méthode K-means.
|
|
|
00
|
|
|
#4 | ||
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
Tu peux faire simple en faisant un tirage uniforme
Code :
Il faudrait écrire ton modèle avec les paramètres estimées avec l'échantillon de test et l'appliquer sur ton échantillon de validation. Il te faudrait une macro pour évaluer la robustesse du modèle (indice de Gini par exelmple) |
||
|
|
00
|
|
|
#5 |
|
Invité de passage
![]() Inscription : juillet 2009 Messages : 11 ![]() |
Si j'ai utilisé la proc Surveyselect c'est parce qu'elle me permet de garder la même proportion de la fréquence d'une variable avec l'option Strata, en d'autre terme, Prob(Y=1) est la même que cela soit dans l’échantillon global ou l’échantillon Apprentissage.
Je pense qu'en attendant de trouver une solution, je vais travailler sur l’échantillon de 70% et appliquer les résultats à d'autres échantillons que je vais tirer de 10%, 20% ou 25% ou 30% ... |
|
|
00
|
|
|
#6 | ||
|
Membre Expert
![]() ![]() Brice BeareParis Inscription : janvier 2011 Messages : 956 ![]() |
Tu trouveras ton bonheur là dessous:
Code :
|
||
|
|
20
|
|
|
#7 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Il faut ajouter l'option OUTALL à la proc SURVEYSELECT, comme ça tu auras toute ta base de départ, et une variable supplémentaire qui indique l'inclusion dans l'échantillon (SELECTED de mémoire).
Oups Brice, je n'avais pas lu que tu avais déjà donné l'info. |
|
|
10
|
|
|
#8 |
|
Invité de passage
![]() Inscription : juillet 2009 Messages : 11 ![]() |
Merci à vous deux, c'est vrai que j'ai zappé l'option OutAll
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com