Bonjour tout le monde, je voudrais savoir comment faire pour extraire des noms propres comme ( Jean, Nicole, Peugeot, Paris, Total SA etc... dun corpus
Merci
Bonjour tout le monde, je voudrais savoir comment faire pour extraire des noms propres comme ( Jean, Nicole, Peugeot, Paris, Total SA etc... dun corpus
Merci
Salut,
C'est-à-dire ? Tu disposes d'une liste de noms propres "possibles" et tu veux chercher lesquels sont dans un paragraphe de texte ? Si c'est ce que tu cherches, tu peux faire quelque chose dans ce style :
Je ne sais pas si ça répond à ta question, n'hésite pas à la préciser dans le cas contraire
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 #! /usr/bin/python texte = "Lorem ipsum dolor sit amet consectetuer scelerisque amet Nulla Morbi nec" liste = [ "mOrbi", "Patrick", "iPsuM" ] for nom in liste: # str.upper permet de passer toutes les chaines en majuscules # et donc d'effectuer une recherche insensible à la casse if str.upper(texte).find(str.upper(nom)) != -1: print "'", nom, "' present dans le texte" else: print "'", nom, "' absent du texte"![]()
Ouai mais le probleme est que apres un point on a une Majuscule et le mot n'est pas forcement un nom propre....
Euh oui..? Mais que veux-tu faire en fait ? Trouver simplement les noms qui commencent par une majuscule ? Si c'est ça, ce sera pas simple, car il y a déjà le problème des majuscules en début de phrase... Au pire tu pourrais ne pas considérer les noms commençant en majuscules placés derrière un point mais du coup tu risques d'oublier des noms propres...Envoyé par Azzuri
Enfin en fait je suis pas certain d'avoir trop compris ce que tu voulais faire, tu pourrais expliquer un peu plus stp ? La solution que je t'ai donné ci-dessus correspond à ton problème, ou pas du tout ??? Tiens nous au courant..
Partager