Utilisation de la librairie re
Bonjour à tous,
Je regardais la fonction de parsing suivante :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
| import re
class Parser:
"""
Class Parser that parse the sentences
"""
def __init__(self, stop_words):
self.stop_words = stop_words
def get_relevant_words(self, input_user):
"""Parse the user input to return the main keywords"""
input_user = re.sub(r"\W+", " ", input_user).lower()
input_user = input_user.split(" ")
parsed_input = []
for word in self.stop_words:
if word in input_user:
input_user.remove(word)
parsed_input = ' '.join(input_user)
parsed_input = parsed_input.strip()
return parsed_input |
Et il y a une partie de que je ne comprends pas :
Code:
input_user = re.sub(r"\W+", " ", input_user).lower()
Le " .lower() " à la fin sert à mettre l'input de l'utilisateur en minuscule. Le " re.sub " sert à modifier la chaîne qu'on a, mais à quoi correspond " r"/W+" " s'il vous plaît ?
Merci de votre aide.