Bonjour à tous,
Je m'excuse d'avance si la réponse est déjà sur le forum, mais je n'ai pas trouvé les bons mots clés pour mon probleme.
J'ai deux dataframes, df1 et df2, que je dois comparer pour trouver les valeurs differentes. Jusqu'ici, pas de probleme, j'utilise pandas et je "merge" mes deux dataframes pour en créer un 3éme, df3, dont les valeurs non similaires de df1 et df2 sont notés NaN.
Ce que je veux, c'est remplacer les valeurs NaN de df3 par celles de df1 et df2 de la cellule correspondante. Par exemple, à la position C6 de df1 il ya jambon, et à la position c6 de df2 il ya saucisson (c'est bien sur un exemple, en vérité ce sont des données cliniques). En position c6 de df3, aprés merged, il yaura donc NaN. Je veux pouvoir faire une opération qui remplacera le NaN de df3 par "jambon et saucisson". Bien entendu, il faudrait faire cette opération sur l'ensemble des cellules NaN de df3.
Mon idée jusqu'à présent c'est de créer une boucle qui parcourt df3 pour tester la condition si position(x,y)==NaN. Si la condition est vrai, alors il récupére la position de la cellule en question, va chercher cette position dans df1 et df2, puis remplace le NaN de df3 par valeur de df1 + "et" + valeur de df2. Mais je n'arrive pas a trouver la fonction qui me permet de recuperer les coordonnees d'une cellule d'un dataframe.
Voilà, j'espere avoir été clair. Merci pour toute aide que vous pourrez m'apporter !
Bonne journée
Fabien
Partager