-
Optimisation de parsing
Bonjour,
Je suis donc confronté à un problème.
J'ai conçu un script qui me permet de parser plusieurs pages HTML et qui enregistre mes informations en base.
Ce script peut être appeler soit par un item soit par un tableau,
c'est à dire que la durée moyenne d’exécution du script pour UN item se situe entre 6 et 8 secondes environ.
Je veux donc essayer d'optimisé l’exécution de ce script.
J'ai essayé avec un outil tel que simplehtmldom mais le temps d’exécution est équivalent à plus du double soit environ 18 secondes.
Je dois peut être utilisé les regex, ou avez-vous d'autres suggestions ?
Bien cordialement,
-
Bonjour,
je ne suis pas sûr que les expressions régulières accélèrent le traitement mais elles devraient permettre de réduire la taille du code.
Il y a une grosse discussion (en anglais) sur le sujet ici : http://stackoverflow.com/questions/3...tml-xml-in-php
Avez-vous identifié ce qui prend le plus de temps ?
Si vos fichiers sont relativement uniformes et que toutes les données ne vous intéressent pas, vous pouvez nettoyer les fichiers avant de les traiter. Par exemple, en supprimant les entêtes et les pieds de page vous devriez gagner du temps.
-
Il faudrait peut être montrer ton script, non?