Échantillon aléatoire avec poids
Bonjour à tous,
J'ai une très grosse base de données que j'essaie de réduire en tirant aléatoirement des individus dedans. Dans la base finale je souhaite que les poids de la population - selon une caractéristique seulement - soit respectés. Cette caractéristique vaut 0 ou 1 et correspond par exemple au fait d'habiter à Paris. Je souhaite que ma base finale soit un échantillon aléatoire de la base initiale qui respecte la proportion de parisiens dans la base totale.
J'ai réussi à coder la création de cette base mais je n'arrive pas à inclure de poids dedans, je ne vois pas vraiment comment faire ... Une idée ? :)
Pour se faire, j'ai séparé ma base initiale en 2 bases : parisiens vs non parisiens et à l'intérieur de celles-ci je tire 500 individus au hasard. Je regroupe ensuite les 2 bases.
Merci d'avance :)
Code:
1 2 3 4 5 6 7 8 9 10 11
|
Base.paris<-Base[is.element(Base$paris,c(1)), ]
Base.nonparis <- Base[is.element(Base$paris,c(0)), ]
ssbase_paris<- Base.paris[sample(1:n_paris, 500, replace=T), ]
ssbase_paris[1:10,]
ssbase_nonparis <- Base.nonparis[sample(1:n_nonparis, 500, replace=T), ]
ssbase_nonparis[1:10,]
mysampledataset <- rbind(ssbase_paris, ssbase_nonparis ) |