Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

+ Répondre à la discussion

Python

Discussion :

please Help: utilisation de utf-16 sous python?

Sujet :

Python

Outils de la discussion
- Afficher une version imprimable
- S'abonner à cette discussion…
Affichage
- Choisir le mode linéaire
- Choisir le mode hybride
- Mode arborescent

Mode arborescent

Message précédent

Message précédent

Message suivant

Message suivant

16/12/2012, 11h30 #1

assoum27

Futur Membre du Club

TALN:inférence grammaticale
Inscrit en
Avril 2010
Messages
16
Détails du profil
Informations professionnelles :
Activité : TALN:inférence grammaticale

Informations forums :
Inscription : Avril 2010
Messages : 16
Points : 7
Points
7

please Help: utilisation de utf-16 sous python?

Bonjour,

actuelement j'esseye d'implémter un prog qui lit le contenu d'une page html et copie le contenu sur un fichier TXT.

j'ai réussi a l'implémenté avec codage et encodage UTF-8,

le résultat (le contenu des fichier text) seront analysé par un autre logiciel .

selement voilà ce logiciel n'accepte que les fichier codé en utf-16.

j'ai utilisé le même programme que j'ai développé pour utf-8 en remplaçant .encode('utf8') et .decode ('utf8') par utf-16.(voir ci dessous)

mais lors de l'exécution il m'a généré des erreurs et n'a pas pu s'exécuter,

#C:/python27
# -*- coding: utf-16 -*-

def lire_ecrire_fichier_txt(url, name_file):

print "décut de l'éxécution"
htmlSource = urllib.urlopen(url).read().decode('utf-16')

text=htmlSource.lower().split('<p')[1:]
path = createFile(name_file)
f = open(path, "a")
title=htmlSource.lower().split('<title>')[1:]
for i in title:

if (i[:i.find('</title>')]!=-1):
txt= i[:i.find('</title>')]
text=enlever_balise(txt)
text=netoyer_text(text)
if text!= '':
f.write((text+'\n').encode('utf-16'))
for chunk in htmlSource.lower().split('<p')[1:]:
if(chunk.find('</p>')!=-1):

if chunk[0] != '<':
text= chunk[:chunk.find('</p>')]+"\n"
txt= chunk[:chunk.find('</p>')]+"\n"
text=enlever_balise(txt)
text=netoyer_text(text)

if text!= '':
f.write((text+'\n').encode('utf-16'))

f.close()
nb_token(path)

Répondre avec citation 0 0

+ Répondre à la discussion

Cette discussion est résolue.

TUTORIELS PYTHON

« Discussion précédente | Discussion suivante »

Discussions similaires

interroger DBpedia en utilisant sparql sous python
Par phpines dans le forum Général Python

Réponses: 1
Dernier message: 24/06/2013, 15h31
utilisation de PATH sous python
Par saimyas dans le forum Général Python

Réponses: 4
Dernier message: 14/06/2011, 16h08
utilisation de procedure stockée dans un select sous python
Par awalter1 dans le forum Oracle

Réponses: 0
Dernier message: 14/10/2010, 14h47
utiliser xor sous python
Par nina08 dans le forum Général Python

Réponses: 6
Dernier message: 04/08/2008, 15h30
doc sur l'utilisation de bases de données SQL sous python
Par moon93 dans le forum Général Python

Réponses: 2
Dernier message: 03/08/2007, 15h09

Partager

Partager

×

Vous avez un bloqueur de publicités installé.

Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.

Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.