Bonjour,

Je poste ce message car j'ai un problème pour parser sans problèmes mes phrases.

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
 
((u'Systeme',), (u'Telephonie',), (u'Applicatif',), (u'Antivirus',), (u'Autre',), (u'DNS',), (u'Filtrage',), (u'systemes linux redhat',), (u'tuxedo',), (u'systemes linux redhat / unix aix',), (u'systeme aix',), (u'systeme unix aix',), (u' 8.3',))
Pour spliter les mots, j'ai utilisé, avec liste_tuple qui a mon tuple de phrases récupérés de ma BDD.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
 
    liste = list(liste_tuple)
    while (liste != []):
            fichier = str(liste.pop(0))
            liste_mots = fichier.split(' ')
            print type(liste_mots)
            print liste_mots
            while (liste_mots != []):
                mot = str(liste_mots.pop(0))
                my_mot = str(mot)
                print type(my_mot), my_mot
                if my_mot not in dictionnaire:
                    print "Don't Exist"
                    dictionnaire[mot] = 1
                else:
                    print "Existe"
                    dictionnaire[my_mot] = dictionnaire[my_mot] + 1
    print dictionnaire
Or, le problème est que je récupère des mots, qui gardent les symboles d'unicodes, etc...

Par exemple:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
["(u'Systeme',)"]
<type 'str'> (u'Systeme',)
Don't Exist
<type 'list'>
["(u'Telephonie',)"]
<type 'str'> (u'Telephonie',)
Don't Exist
<type 'list'>
["(u'Applicatif',)"]
<type 'str'> (u'Applicatif',)
Don't Exist
<type 'list'>
["(u'Antivirus',)"]
<type 'str'> (u'Antivirus',)
Don't Exist
<type 'list'>
["(u'Autre',)"]
<type 'str'> (u'Autre',)
Don't Exist
<type 'list'>
["(u'DNS',)"]
<type 'str'> (u'DNS',)
Don't Exist
<type 'list'>
["(u'Filtrage',)"]
<type 'str'> (u'Filtrage',)
Don't Exist
<type 'list'>
["(u'systemes", 'linux', "redhat',)"]
<type 'str'> (u'systemes
Don't Exist
<type 'str'> linux
Don't Exist
<type 'str'> redhat',)
Don't Exist
<type 'list'>
["(u'tuxedo',)"]
<type 'str'> (u'tuxedo',)
Don't Exist
<type 'list'>
["(u'systemes", 'linux', 'redhat', '/', 'unix', "aix',)"]
<type 'str'> (u'systemes
Existe
<type 'str'> linux
Existe
<type 'str'> redhat
Don't Exist
<type 'str'> /
Don't Exist
<type 'str'> unix
Don't Exist
<type 'str'> aix',)
Don't Exist
Je ne sais pas du tout comment les transformer en string simple...

Merci d'avance.

Cordialement,