ElementTree probleme de parsage d'un document html

**marcolo** · 02/06/2009, 13h49

Bonjour,
j'essaie d'utiliser un script eqhtml.py qui permet d'inserer des equations dans un document html en passant par un script python qui effectue la conversion au prealable (il lance latex sur chaque equation, qu'il convertit en image) :

http://www.fauskes.net/nb/htmleqII/#the_code

Ca marche presque a la perfection, le seul probleme, c'est qu'initialement, mon fichier html aura cette tete :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
 
<head>
<title>Test</title>
<link rel="stylesheet" href="guide.css" type="text/css"/>
<link href="prettify.css" type="text/css" rel="stylesheet"/>
<script type="text/javascript" src="prettify.js"></script>
</head>
 
<body onload="prettyPrint()">
 
 
<div class="eq">
\int_a^b \, f(x) \, dx \, = \, \sum_{k=1}^N \int_{x_k}^{x_{k+1}} \,
f(x) \, dx \, = \, \sum_{k=1}^N \, \sum_{j=1}^{r+1} \, \omega_j
(x_{k+1}-x_k) f( (1-\xi_j)x_{k} + \xi_j x_{k+1})
</div>
 
</body>
</html>

Et a la sortie, j'obtiens le fichier suivant :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<html:html lang="en" xml:lang="en" xmlns:html="http://www.w3.org/1999/xhtml">
 
<html:head>
<html:title>Test</html:title>
<html:link href="guide.css" rel="stylesheet" type="text/css" />
<html:link href="prettify.css" rel="stylesheet" type="text/css" />
<html:script src="prettify.js" type="text/javascript" />
</html:head>
 
<html:body onload="prettyPrint()">
 
 
<html:div class="eq"><img alt="" src="eqtest1.png" /></html:div>
 
</html:body>
</html:html>

Bon, la je me mefie pas trop, je me dis que le navigateur va se debrouiller avec ca, ben en fait pas du tout. Il n'aime pas du tout les balises html:body, html:div, il prefere body et div. Donc je voudrais savoir comment on fait pour ne pas mettre ces html: partout lorsqu'on fait une sortie avec ElementTree d'un fichier html. Pour le moment, je vire tous ces html: avec emacs, mais c'est "manuel" (enfin j 'enleve tout d'un coup, mais faut taper la commande pour chaque fichier converti.

Voila, si vous avez une solution a proposer ...
Merci

ElementTree probleme de parsage d'un document html

Python

Mode arborescent

Discussions similaires

Partager

Partager