Bonjour à tous,
J'ai une très grosse base de données que j'essaie de réduire en tirant aléatoirement des individus dedans. Dans la base finale je souhaite que les poids de la population - selon une caractéristique seulement - soit respectés. Cette caractéristique vaut 0 ou 1 et correspond par exemple au fait d'habiter à Paris. Je souhaite que ma base finale soit un échantillon aléatoire de la base initiale qui respecte la proportion de parisiens dans la base totale.
J'ai réussi à coder la création de cette base mais je n'arrive pas à inclure de poids dedans, je ne vois pas vraiment comment faire ... Une idée ?
Pour se faire, j'ai séparé ma base initiale en 2 bases : parisiens vs non parisiens et à l'intérieur de celles-ci je tire 500 individus au hasard. Je regroupe ensuite les 2 bases.
Merci d'avance
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 Base.paris<-Base[is.element(Base$paris,c(1)), ] Base.nonparis <- Base[is.element(Base$paris,c(0)), ] ssbase_paris<- Base.paris[sample(1:n_paris, 500, replace=T), ] ssbase_paris[1:10,] ssbase_nonparis <- Base.nonparis[sample(1:n_nonparis, 500, replace=T), ] ssbase_nonparis[1:10,] mysampledataset <- rbind(ssbase_paris, ssbase_nonparis )
Partager