Bonjour,
Je souhaite créer quinze nouveaux dataframe contenant des échantillons de mon dataframe original.
Ces nouveaux dataframes devront s'appeler df1, df2,… df15.
Donc, travaillant sur des bases de données de plusieurs centaines de milliers de ligne, je souhaiterai faire une boucle (je me suis penchée sur une boucle
mais je ne sais pas si c'est ce qu'il y a de plus optimisé).
Néanmoins, je ne trouve pas de code me permettant de faire ce que je veux.
J'ai bien un code pour tirer mes échantillons (qui sont 1% de mon jeu de données) :
df1 = df_original.sample(frac=0.01)
Mais rien pour faire une boucle et surtout créer un nouveau dataframe avec un nouveau nom à chaque fois.
Avez-vous des idées ?
A savoir que je suis sur Python 2.7.
Merci par avance!
Partager