Bonjour à tous
Je cherche à créer un jeu de données XLS
J'ai téléchargé des datasets en CSV de prénoms et patronymes sur https://www.data.gouv.fr/fr/datasets...et-patronymes/
J'ai également un fichier CSV comportant des pathologies
Je souhaite créer un job générant 2000 enregistrements en piochant un prénom aléatoire du fichier, un nom aléatoire du fichier, une pathologie aléatoire du fichier et un age aléatoire ( 0<Age<95)
Comment intégrer pondération dans les tirages (exemple : 20% de prénom masculin), le genre et la fréquence étant présente dans le fichier
Comment procéderiez vous ?
Je vous remercie
_Agrid
Partager