wget récupère un code source d'une version antérieure à celle en ligne
Bonjour,
Pour un script j'ai besoin de télécharger une page régulièrement afin d'agir en fonction de ses changements.
Mais ma ligne wget me pose un problème, lors de la 1ere boucle tout se passe bien mais aprés wget récupère toujours le même code source meme si le code de la page évolué entre temps .
-j'ai pensé que ca pouvait être un problème de cache donc j'ai essayé avec les options : --no-cache, --cache=off, -nc mais sans plus de succès .
-le fichier dans lequel j'enregistre la page web est supprimer avant de relancer le wget
voila la fonction en question:
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
| function recuptwitter
{
wget --output-document=twitter.txt "http://twitter.com/xxxxx"
grep "published timestamp" twitter.txt >> lien0.txt
#suppression de tout ce qui precede le" du lien ligne par ligne
while read LIEN
do
echo ${LIEN#*time:\'} >> lien1.txt
done < lien0.txt
#suppression de tout ce qui suit le" du lien ligne par ligne
while read LIEN
do
echo ${LIEN%%\'\}\">*} >> lien2.txt
done < lien1.txt
#comparaison avec la date de la derniere verification
NBTWEET=0
LASTCHK=$(cat lastchecktwitter.txt)
while read LIEN
do
if [ "$LASTCHK" != "$LIEN" ]
then NBTWEET=$(($NBTWEET+1))
else break 1
fi
done < lien2.txt
grep -m 1 "0" lien2.txt > lastchecktwitter.txt
#recuperation des liens
if [ $NBTWEET -gt 0 ]
then
grep "tweet-url web" twitter.txt > lien3.txt
while read LIEN
do
echo ${LIEN#*href=\"} >> lien4.txt
done < lien3.txt
while read LIEN
do
echo ${LIEN%%\" class*} >> lien5.txt
done < lien4.txt
grep -m $NBTWEET "http://" lien5.txt > flien.txt
fi
rm lien*.txt
rm twitter.txt
} |
Si vous avez une idée ca m'arrangerez bien, tout le script marche sauf ce wget qui doit déclencher tout le reste ...
Merci d'avance :)