Bonjour,
J'ai un souci d'encodage. J'utillise onehotencoder de scikit learn pour encoder une variable feat1 en plusieurs variables binaires.
Quand j'encode, j'obtiens un dataframe qui ne contient pas de NaN. Puis, quand je l'ajoute à mon dataframe X, 2 Nan apparaissent. Pas moyen de comprendre la raison.
Peut être un problème d'index mais??
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 enc = OneHotEncoder(handle_unknown='ignore') Feat_enc = pd.DataFrame(enc.fit_transform(X[["feat1"]]).toarray()) X=X.join(Feat_enc)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 Feat_enc.isna().sum() 0Avez-vous une idée svp?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 X.isna().sum() 2
Merci
Partager