Bonjour,
Pour splitter une phrase en ses mots et caractères de ponctuation :
1 2 3 4 5 6 7 8 9
| import string
import re
phrase = 'Test de phrase: A splitter sur les mots, la ponctuation. Pour l\'application d\'une "jetonisation" impeccable!'
ponct = string.punctuation
res = re.findall(r"[\w']+|["+ponct+"]", phrase)
print(res) |
retourne
['Test', 'de', 'phrase', ':', 'A', 'splitter', 'sur', 'les', 'mots', ',', 'la', 'ponctuation', '.', 'Pour', "l'application", "d'une", '"', 'jetonisation', '"', 'impeccable', '!']
Comment m'y prendre pour splitter également les apostrophes?
Merci
Partager