Analyse de texte "Mots doubles "

**VincentB29** · 04/02/2019, 19h51

Bonjour,

J'ai un texte et j'aimerai trouver tous les mots en double.

J'ai commencé par faire un split() afin d'avoir tout le texte mots par mots dans une liste.
Je pensai faire une boucle afin de comparer chaque mots lettres par lettres dans la liste , mais je pense que c'est pas la bonne méthode...
Je n'ai pas trouvé de fonction appars findall() ou count() qui pourrait aider peut être.

Quelqu'un aurait-il une idée ?

Merci d'avance!

**fred1599** · 04/02/2019, 20h04

Bonsoir,

Va voir du côté de counter

**VincentB29** · 05/02/2019, 14h04

Oui mais cette fonction la marche que lorsque l'on cherche un mot précis dans le texte..

Je pensai faire ceux-ci:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
fichier=open('C:\\Users\\LATITUDE\\Desktop\\Le Diable au Corps.txt','r')
T=[]
for line in fichier:
    li=line.strip().split()
    T.append(li[:])
 
       for i in range len(T):
print T.find_all(i)

**fred1599** · 05/02/2019, 16h16

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
from collections import Counter
 
example = ["mot", "test", "mot", "exemple", "autre", "test", "test"]
 
 
print(Counter(example))

donne

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

Counter({'test': 3, 'mot': 2, 'autre': 1, 'exemple': 1})

Quels sont les mots en double ?

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
res_dict = Counter(example)
 
for w in res_dict:
    if res_dict[w] == 2:
        print(w)

affiche bien "mot"

**VincentB29** · 06/02/2019, 12h18

Merci super ça marche !

J'avais confondu la fonction count() et counter(). Une fonction bien pratique ...

Deuxième question :

Lorsque je décompose le texte j'ai des numéros et caractère comme : '\x92\xe0' qui apparaissent

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
['Jusqu\x92\xe0',
 'douze',
 'ans,',
 'je',
 'ne',
....]

Je pensais utiliser la fonction strip() , mais ça ne change rien...

Auriez-vous une idée ?

**fred1599** · 06/02/2019, 13h22

la liste n'est pas un objet qu'on affiche, très souvent, on va formater pour avoir la réponse souhaitée avec un print pour son affichage.

Que fait un print(liste[0]) où liste est la liste que vous nous présentez ?

Analyse de texte "Mots doubles "

Python

Vue hybride

Discussions similaires

Partager

Partager