Bonjour,
Je poste ce message car j'ai un problème pour parser sans problèmes mes phrases.
Pour spliter les mots, j'ai utilisé, avec liste_tuple qui a mon tuple de phrases récupérés de ma BDD.Code:
2
Or, le problème est que je récupère des mots, qui gardent les symboles d'unicodes, etc...Code:
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18liste = list(liste_tuple) while (liste != []): fichier = str(liste.pop(0)) liste_mots = fichier.split(' ') print type(liste_mots) print liste_mots while (liste_mots != []): mot = str(liste_mots.pop(0)) my_mot = str(mot) print type(my_mot), my_mot if my_mot not in dictionnaire: print "Don't Exist" dictionnaire[mot] = 1 else: print "Existe" dictionnaire[my_mot] = dictionnaire[my_mot] + 1 print dictionnaire
Par exemple:
Je ne sais pas du tout comment les transformer en string simple...Code:
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
Merci d'avance.
Cordialement,
