Bonjour,
J'ai un souci d'encodage. J'utillise onehotencoder de scikit learn pour encoder une variable feat1 en plusieurs variables binaires.
Quand j'encode, j'obtiens un dataframe qui ne contient pas de NaN. Puis, quand je l'ajoute à mon dataframe X, 2 Nan apparaissent. Pas moyen de comprendre la raison.
Peut être un problème d'index mais??
Code:
1
2
3 enc = OneHotEncoder(handle_unknown='ignore') Feat_enc = pd.DataFrame(enc.fit_transform(X[["feat1"]]).toarray()) X=X.join(Feat_enc)
Code:
1
2 Feat_enc.isna().sum() 0
Avez-vous une idée svp?Code:
1
2 X.isna().sum() 2
Merci