Bonjour,
Je poste ce message car j'ai un problème pour parser sans problèmes mes phrases.
Pour spliter les mots, j'ai utilisé, avec liste_tuple qui a mon tuple de phrases récupérés de ma BDD.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 ((u'Systeme',), (u'Telephonie',), (u'Applicatif',), (u'Antivirus',), (u'Autre',), (u'DNS',), (u'Filtrage',), (u'systemes linux redhat',), (u'tuxedo',), (u'systemes linux redhat / unix aix',), (u'systeme aix',), (u'systeme unix aix',), (u' 8.3',))
Or, le problème est que je récupère des mots, qui gardent les symboles d'unicodes, etc...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 liste = list(liste_tuple) while (liste != []): fichier = str(liste.pop(0)) liste_mots = fichier.split(' ') print type(liste_mots) print liste_mots while (liste_mots != []): mot = str(liste_mots.pop(0)) my_mot = str(mot) print type(my_mot), my_mot if my_mot not in dictionnaire: print "Don't Exist" dictionnaire[mot] = 1 else: print "Existe" dictionnaire[my_mot] = dictionnaire[my_mot] + 1 print dictionnaire
Par exemple:
Je ne sais pas du tout comment les transformer en string simple...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53 ["(u'Systeme',)"] <type 'str'> (u'Systeme',) Don't Exist <type 'list'> ["(u'Telephonie',)"] <type 'str'> (u'Telephonie',) Don't Exist <type 'list'> ["(u'Applicatif',)"] <type 'str'> (u'Applicatif',) Don't Exist <type 'list'> ["(u'Antivirus',)"] <type 'str'> (u'Antivirus',) Don't Exist <type 'list'> ["(u'Autre',)"] <type 'str'> (u'Autre',) Don't Exist <type 'list'> ["(u'DNS',)"] <type 'str'> (u'DNS',) Don't Exist <type 'list'> ["(u'Filtrage',)"] <type 'str'> (u'Filtrage',) Don't Exist <type 'list'> ["(u'systemes", 'linux', "redhat',)"] <type 'str'> (u'systemes Don't Exist <type 'str'> linux Don't Exist <type 'str'> redhat',) Don't Exist <type 'list'> ["(u'tuxedo',)"] <type 'str'> (u'tuxedo',) Don't Exist <type 'list'> ["(u'systemes", 'linux', 'redhat', '/', 'unix', "aix',)"] <type 'str'> (u'systemes Existe <type 'str'> linux Existe <type 'str'> redhat Don't Exist <type 'str'> / Don't Exist <type 'str'> unix Don't Exist <type 'str'> aix',) Don't Exist
Merci d'avance.
Cordialement,
Partager