Bonjour à tous,
je converti un fichier excel sous forme de dataframe pour faire d'autres manipulations ensuite, sauf qu'à la fin je me suis rendue compte que j'avais des valeurs suivi d'un espace (à droite) que je n'avais pas vu.
Voici mon code
Les espaces qui m'embêtent sont dans la colonne "Test result" du dataframe et la méhode str.rstrip renvoi l'erreur suivante que j'avoue ne pas bien comprendre :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 # Convert xlsx file in dataframe and filter on column data = pd.read_excel(sys.argv[1]) data_filter = pd.DataFrame(data, columns = ["Strain ID", "Test result"]) # Remove right space and duplicates and not defined row in dataframe data_filter = data_filter[data_filter["Test result"].str.rstrip()] data_filter.drop_duplicates(keep = 'first', inplace=True) print(data_filter)
Merci d'avance pour votre aide
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 File "/Softs/virtualenvPython/Genome_panel/lib/python3.8/site-packages/pandas/core/indexes/base.py", line 5782, in _get_indexer_strict self._raise_if_missing(keyarr, indexer, axis_name) File "/Softs/virtualenvPython/Genome_panel/lib/python3.8/site-packages/pandas/core/indexes/base.py", line 5842, in _raise_if_missing raise KeyError(f"None of [{key}] are in the [{axis_name}]")
Partager