Probleme sur l'échantillonnage par stratification
Bonjour,
Je suis confronté à un problème pour faire un échantillonnage par stratification, si quelqu'un pouvait m'aider ou me donner des piste ça me serait très utile :
Pour faire cette échantillonnage j'utilise la fonction "strata" de la librairy "sampling", le problème est que cette fonction prend en paramètre un vector contenant le nombre d'individu voulu DANS CHAQUE STRAT or j'aimerais pouvoir faire cette échantillonnage en fournissant le pourcentage de chaque Variable de catégorie.
Exemple :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| sexe <- c("Homme", "Homme", "Femme", "Homme", "Femme", ...)
> region <- c("Nord", "Sud", "Ouest", "Ouest", "Nord", ...)
> dataTest <- data.frame(sexe, region)
> dataTest
sexe region
1 Homme Nord
2 Homme Sud
3 Femme Ouest
4 Homme Ouest
5 Femme Nord
...
> table(dataTest)
region
sexe Nord Ouest Sud
Femme 320 250 0
Homme 300 270 90 |
La fonction "strata" veut en parametre le nombre d'individu pour les strats : Femme/Nord, Homme/Nord, Femme/Ouest, etc...
Je voudrais pouvoir convertir les entrées :
Code:
1 2
| tailleEchantillon = X
paramIndividu = list("Sexe"=c(0.6,0.4), "Region"=c(0.4,0.4,0.2)) |
En entrée de la fonction "strata" ou savoir si il existe une fonction qui permet de stratifié directement avec ces paramètres?
Merci !