Bonjour,

Je suis confronté à un problème pour faire un échantillonnage par stratification, si quelqu'un pouvait m'aider ou me donner des piste ça me serait très utile :
Pour faire cette échantillonnage j'utilise la fonction "strata" de la librairy "sampling", le problème est que cette fonction prend en paramètre un vector contenant le nombre d'individu voulu DANS CHAQUE STRAT or j'aimerais pouvoir faire cette échantillonnage en fournissant le pourcentage de chaque Variable de catégorie.

Exemple :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
sexe <- c("Homme", "Homme", "Femme", "Homme", "Femme", ...)
> region <- c("Nord", "Sud", "Ouest", "Ouest", "Nord", ...)
> dataTest <- data.frame(sexe, region)
> dataTest
   sexe region
1 Homme   Nord
2 Homme    Sud
3 Femme  Ouest
4 Homme  Ouest
5 Femme   Nord
...
 
> table(dataTest)
       region
sexe    Nord Ouest Sud
Femme   320     250   0
Homme   300     270   90
La fonction "strata" veut en parametre le nombre d'individu pour les strats : Femme/Nord, Homme/Nord, Femme/Ouest, etc...
Je voudrais pouvoir convertir les entrées :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
tailleEchantillon = X
paramIndividu = list("Sexe"=c(0.6,0.4), "Region"=c(0.4,0.4,0.2))
En entrée de la fonction "strata" ou savoir si il existe une fonction qui permet de stratifié directement avec ces paramètres?

Merci !