Bonjour à tous,
Je suis débutante en Python et j'essaye de faire un script pour extraire le nombre de balise <Page> afin de connaitre le nombre de pages que j'ai dans mon fichier XML. Ce fichier XML est très grand c'est pourquoi j'utilise le module SAX.
Voici mon code:
Merci de votre aide !
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31 #!/usr/bin/python #-*- coding:utf-8 -*- import string import sys from xml.sax import ContentHandler,make_parser class MaClasseContentHandler(ContentHandler): def startElement(self, name, attrs): print "Start element:", name class MaClassePage(ContentHandler): def __init__(self): ContentHandler.__init__(self) self.n = 0 def startElement(self, Page, attrs): self.n += 1 ####parser = make_parser()# parser le doc ####handler = MaClasseContentHandler() ####parser.setContentHandler(handler) ####parser.parse("monfic.xml") handler = MaClassePage() parser = make_parser() parser.setContentHandler(handler) parser.parse("monfic.xml") print handler.n
Partager