comptage de balise <Page> dans un grand fichier XML
Bonjour à tous,
Je suis débutante en Python et j'essaye de faire un script pour extraire le nombre de balise <Page> afin de connaitre le nombre de pages que j'ai dans mon fichier XML. Ce fichier XML est très grand c'est pourquoi j'utilise le module SAX.
Voici mon code:
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
|
#!/usr/bin/python
#-*- coding:utf-8 -*-
import string
import sys
from xml.sax import ContentHandler,make_parser
class MaClasseContentHandler(ContentHandler):
def startElement(self, name, attrs):
print "Start element:", name
class MaClassePage(ContentHandler):
def __init__(self):
ContentHandler.__init__(self)
self.n = 0
def startElement(self, Page, attrs):
self.n += 1
####parser = make_parser()# parser le doc
####handler = MaClasseContentHandler()
####parser.setContentHandler(handler)
####parser.parse("monfic.xml")
handler = MaClassePage()
parser = make_parser()
parser.setContentHandler(handler)
parser.parse("monfic.xml")
print handler.n |
Merci de votre aide !