Recursion sur un arbre DOM
Bonjour a tous,
J"ai un tout petit probleme d'algorithme...
en effet, je voudrais parcourir un arbre DOM, fourni par la librairie BeautifulSoup, avec une fonction recursive...voici ma fonction:
Code:
1 2 3 4 5 6 7
|
def getChildrenText(self, dom):
if type(dom) is types.InstanceType:
for child in dom:
return self.getChildrenText(child)
else:
return dom.string |
voici la structure du document DOM:
Code:
1 2 3 4 5 6 7 8 9 10 11
| html --
|
-- head --
| |
| -- title
|
-- body --
|
-- table --
|
-- tr |
enfin vous voyez le genre de structure...
mon probleme est que je n'arrive qu'a obtenir le contenu des premiers elements de l'arbre.
soit le contenu texte de head et de body...
Comment dois-je m'y prendre pour egalement obtenir le contenu de chacun des enfants?? Soit par exemple, chacun des TD de chacun des TR de l'element TABLE??
merci pour toute reponse!
cP