Bonjour à tous,
Je suis débutante en Python et j'essaye de faire un script pour extraire le nombre de balise <Page> afin de connaitre le nombre de pages que j'ai dans mon fichier XML. Ce fichier XML est très grand c'est pourquoi j'utilise le module SAX.
Voici mon code:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
 
#!/usr/bin/python
#-*- coding:utf-8 -*-
import string
import sys
from xml.sax import ContentHandler,make_parser
 
 
class MaClasseContentHandler(ContentHandler):
  def startElement(self, name, attrs):
     print "Start element:", name
 
class MaClassePage(ContentHandler):
    def __init__(self):
        ContentHandler.__init__(self)
        self.n = 0
 
    def startElement(self, Page, attrs):
        self.n += 1
 
####parser = make_parser()# parser le doc
####handler = MaClasseContentHandler()
####parser.setContentHandler(handler)
####parser.parse("monfic.xml")
 
handler = MaClassePage()
parser = make_parser()
parser.setContentHandler(handler)
parser.parse("monfic.xml")
 
print  handler.n
Merci de votre aide !