Bonjour à tous,
Pour contextualiser, j'ai un script qui se lance chaque jour afin de parcourir une page xml (qui est mis à jour de manière aléatoire) et de récupérer du contenu.
Voici un exemple du code :
Aujourd'hui ce script me permet de récupérer le contenu du jour (si il a été mis à jour).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 from lxml import etree import datetime date = datetime.datetime.today().strftime('%d/%m/%Y') tree = etree.parse(".../fichier.xml") for date in tree.xpath("/TRUCS/TRUC1[DATE_MAJ_TRUC='%s']/URL_TRUC" % date): print(date.text)
Cependant je souhaiterais l'optimiser en faisant en sorte de garder en mémoire la dernière date à laquelle il a récupéré du contenu, et de comparer cette date aux balises "DATE_MAJ_TRUC" de mon xml et de ne récupérer le contenu uniquement que si la date présente est supérieure à la date enregistrée au préalable.
Et évidement, si je récupère du contenu, je souhaiterais écraser la précédente date par la nouvelle.
Une idée ?
Partager