espace à supprimer dans colonne de dataframe
Bonjour à tous,
je converti un fichier excel sous forme de dataframe pour faire d'autres manipulations ensuite, sauf qu'à la fin je me suis rendue compte que j'avais des valeurs suivi d'un espace (à droite) que je n'avais pas vu.
Voici mon code
Code:
1 2 3 4 5 6 7 8
| # Convert xlsx file in dataframe and filter on column
data = pd.read_excel(sys.argv[1])
data_filter = pd.DataFrame(data, columns = ["Strain ID", "Test result"])
# Remove right space and duplicates and not defined row in dataframe
data_filter = data_filter[data_filter["Test result"].str.rstrip()]
data_filter.drop_duplicates(keep = 'first', inplace=True)
print(data_filter) |
Les espaces qui m'embêtent sont dans la colonne "Test result" du dataframe et la méhode str.rstrip renvoi l'erreur suivante que j'avoue ne pas bien comprendre :
Code:
1 2 3 4
| File "/Softs/virtualenvPython/Genome_panel/lib/python3.8/site-packages/pandas/core/indexes/base.py", line 5782, in _get_indexer_strict
self._raise_if_missing(keyarr, indexer, axis_name)
File "/Softs/virtualenvPython/Genome_panel/lib/python3.8/site-packages/pandas/core/indexes/base.py", line 5842, in _raise_if_missing
raise KeyError(f"None of [{key}] are in the [{axis_name}]") |
Merci d'avance pour votre aide