Bonjour à tous,

J'ai une très grosse base de données que j'essaie de réduire en tirant aléatoirement des individus dedans. Dans la base finale je souhaite que les poids de la population - selon une caractéristique seulement - soit respectés. Cette caractéristique vaut 0 ou 1 et correspond par exemple au fait d'habiter à Paris. Je souhaite que ma base finale soit un échantillon aléatoire de la base initiale qui respecte la proportion de parisiens dans la base totale.

J'ai réussi à coder la création de cette base mais je n'arrive pas à inclure de poids dedans, je ne vois pas vraiment comment faire ... Une idée ?

Pour se faire, j'ai séparé ma base initiale en 2 bases : parisiens vs non parisiens et à l'intérieur de celles-ci je tire 500 individus au hasard. Je regroupe ensuite les 2 bases.

Merci d'avance

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
 
Base.paris<-Base[is.element(Base$paris,c(1)), ]
Base.nonparis <- Base[is.element(Base$paris,c(0)), ]
 
ssbase_paris<- Base.paris[sample(1:n_paris, 500, replace=T), ]
ssbase_paris[1:10,]
 
ssbase_nonparis <- Base.nonparis[sample(1:n_nonparis, 500, replace=T), ]
ssbase_nonparis[1:10,]
 
mysampledataset <- rbind(ssbase_paris, ssbase_nonparis )