Bonjour,

J'ai un fichier qui s'appelle dico.txt qui se présente comme suit :

le pronom det
boucher nom verbe
ferme nom verbe
la pronom det
porte nom verbe

Il y a donc une forme lexicale suivit d'une ou plusieurs catégories syntaxiques.

Je souhaiterais réunir toutes mes catégories en une liste, pour ensuite pouvoir compter le nombre d’occurrences de chacune des catégories.

Voici mon script :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import re
import string
 
def fonct_cat(dico):
    f = open(dico, "r")
    dic = f.readlines()
    f.close()
 
    di = {}
    for cat in dic:
        s=string.split(cat)
        di[s[0]]=s[1:]
 
    print di        
 
    valeurs=di.values()
 
    listecat=list(valeurs)
 
 
 
categorie=fonct_cat("dico.txt")
print categorie
mais j'obtiens :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
{'meme': ['adverbe', 'adjectif'], 'vais': ['verbe'], 'en': ['prep'], 'eh': ['interj'], 'dans': ['prep'], 'pot': ['nom'], 'histoire': ['nom'], 'Lili': ['nom'], 'oui': ['adverbe'], 'ne': ['neg'], 'veut': ['verbe'], 'moi': ['nom', 'pronom'], 'aventure': ['nom', 'verbe'], 'faim': ['nom'], 'tarder': ['infinitif'], 'et': ['coord'], 'oublie': ['Ppasse'], 'connait': ['verbe'], 'courage': ['nom'], 'est': ['verbe'], 'miel': ['nom'], 'mais': ['coord'], 'peu': ['adverbe'], 'alors': ['adverbe'], 'etourdie': ['nom', 'adjectif', 'Ppasse'], 'bien': ['adjectif', 'adverbe', 'nom'], 'toute': ['adjectif'], 'perdre': ['infinitif'], 'abeille': ['nom'], 'chemin': ['nom'], 'pas': ['adverbe', 'nom'], 'tiens': ['verbe'], 'mangeais': ['verbe'], 'un': ['det'], 'mettre': ['infinitif'], 'valise': ['nom'], 'sais': ['verbe'], 'petite': ['adjectif', 'nom'], 'de': ['prep'], 'recherche': ['nom', 'verbe'], 'elle': ['pronom'], 'decouvrir': ['infinitif'], 'quelqu': ['adjectif', 'adverbe'], 'monde': ['nom'], 'le': ['det', 'pronom'], 'prend': ['verbe'], 'mon': ['adjectif'], 'qui': ['pronom'], 'je': ['pronom'], 'du': ['article'], 'd': ['prep'], 'a': ['verbe'], '\xe0': ['prep'], 'c': ['pronom'], 'sans': ['prep'], 'faire': ['infinitif'], 'cette': ['adjectif'], 'l': ['det'], 'si': ['conj'], 'part': ['nom', 'verbe'], 'une': ['det'], 'bon': ['nom', 'adjectif'], 'dit': ['verbe'], 'sa': ['adjectif'], 'se': ['pronom']}
None
J'aimerais en fait juste obtenir la liste des catégories, c'est-à-dire les valeurs entre crochets.

Merci beaucoup,