Bonjour,
J'ai écrit un bout de code dont le but est de modifier les champs d'une colonne, en fonction de leurs valeurs (Par exemple, un "RED" et un "R" vont devenir "Red").
C'est très basique, par contre, je n'ai pas trouvé le moyen de l'optimiser en l'écrivant en utilisant moins de lignes (avec des "or" ou autres). Du coup, j'ai dupliqué bêtement mes lignes pour chaque valeur. Est-ce que vous auriez une idée d'optimisation de ce code ?
Merci par avance pour votre aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 # On homogéneise le nom de la colonne Colour_raw df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'RED'] = 'Red' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'R'] = 'Red' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'red'] = 'Red' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'BLUE'] = 'Blue' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Bleu'] = 'Blue' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Blue'] = 'Blue' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'B'] = 'Blue' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'G'] = 'Green' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'GREEN'] = 'Green' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Green'] = 'Green' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'green'] = 'Green' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'O'] = 'Orange' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Orang'] = 'Orange' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Orange'] = 'Orange' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'PURP'] = 'Purple' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Purpal'] = 'Purple' df_config['Colour_raw'].loc[df_config['Colour_raw'] == 'Purple'] = 'Purple'
PS.:
A toutes fin utiles, je joints le code général dont il est issue.
Partager