Bonjour à tous,

Pour contextualiser, j'ai un script qui se lance chaque jour afin de parcourir une page xml (qui est mis à jour de manière aléatoire) et de récupérer du contenu.

Voici un exemple du code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
 
from lxml import etree 
import datetime
 
date = datetime.datetime.today().strftime('%d/%m/%Y')
tree = etree.parse(".../fichier.xml")
 
for date in tree.xpath("/TRUCS/TRUC1[DATE_MAJ_TRUC='%s']/URL_TRUC" % date):
    print(date.text)
Aujourd'hui ce script me permet de récupérer le contenu du jour (si il a été mis à jour).

Cependant je souhaiterais l'optimiser en faisant en sorte de garder en mémoire la dernière date à laquelle il a récupéré du contenu, et de comparer cette date aux balises "DATE_MAJ_TRUC" de mon xml et de ne récupérer le contenu uniquement que si la date présente est supérieure à la date enregistrée au préalable.
Et évidement, si je récupère du contenu, je souhaiterais écraser la précédente date par la nouvelle.

Une idée ?