python 2.7.3 UnicodeWarning
Bonjour a tous
pour charger un fichier .txt j'ai fait ça
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
|
def charge_fichier(nomFile,cpt_doc):
global nb_doc
f=codecs.open(nomFile,'r','utf-8')
if(not f):return 0;
nb_doc+=1;
t=f.read()
t=t.lower()
a=t.split()
for mot in a:
if(not (mot,cpt_doc) in freq0 ):
freq0[mot,cpt_doc]=a.count(mot)
n0[mot]+=1
f.close()
for (mot ,doc) in freq0 :
poid0[mot,doc]=freq0[mot,doc]*log(nb_doc/n0[mot]+1,10)
## bool
index_bool(indexBoolean_0,a,cpt_doc);
a=[porteur.stem(x)for x in a if not x in ignored_words]
for mot in a:
if(not (mot,cpt_doc) in freq1 ):
freq1[mot,cpt_doc]=a.count(mot)
n1[mot]+=1
f.close()
for (mot ,doc) in freq1 :
poid1[mot,doc]=freq1[mot,doc]*log(nb_doc/n1[mot]+1,10)
index_bool(indexBoolean_1,a,cpt_doc);
return 1; |
mais une erreur UnicodeWarning s'affiche dans la ligne
Code:
a=[porteur.stem(x)for x in a if not x in ignored_words]
comme suite :
Code:
1 2 3 4
|
a=[porteur.stem(x)for x in a if not x in ignored_words]
UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal |
pour éviter cette erreur j'ai enregistré le fichier en UTF-8 ''notpade++''
et j'ai fait ça aussi
Code:
1 2 3 4
|
# -*- coding: utf-8 -*-
import codecs |
mais toujours la meme erreur s'affiche
Merci pour vos repense :ccool::ccool::ccool: