Bonjour,
Je code un petit programme qui (entre autre), à partir de mots présents dans un lexique reprenant le mot et son uri, repère chaque phrase d'un texte segmenté qui contient le mot de ce lexique. Chacune de ces phrases doivent s'ajouter à une nouvelle liste (ci-dessous "new_list").
Voici un exemple simplifié:
J'aimerais comme résultat dans "new_list" : ['Bonjour, vous allez bien? <http://bonjour.com> <http://bien.com>' , ...]. Or il ajoute à new_list deux fois la phrase ; une fois pour chaque occurence : ['Bonjour, vous allez bien? <http://bonjour.com>', 'Bonjour, vous allez bien? <http://bonjour.com><http://bien.com>', ...].
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12 sents = ['Bonjour, vous allez bien?', 'Au revoir' , 'bye bye' , 'Merci. A ce soir!'] lexic = [('Bonjour', 'http://bonjour.com') , ('bien', 'http://bien.com') , ('bye', 'http://bye.com')] new_list = [] for s in sents: for l in lexic: if l[0] in s: s = s + " <" + l[1] + ">" #J'ajoute l'uri du mot présent dans le lexique à la fin de la phrase. new_list.append(s) print(new_list)
Et c'est très logique d'ailleurs si on analyse le fonctionnement de la boucle... Seulement je suis un peu à court d'idées, je suis pourtant sûr qu'il doit exister une parade très simple :/
Merci d'avance ! (J'espère que c'est plus ou moins clair :p)
Partager