Bonjour,

j'ai fait un script qui permet de feuilleter plusieurs pages d'un site web et de copier ces données dans un fichier .txt

Il y a environ une cinquantaine de page web. L'idée est de voir si des données sont modifiées sur les pages qui m'intéressent.

Ce programme fonctionne à un détail près :

Parfois les données que je récupère sont en anglais, alors que quand je visite la page (au même moment) je les vois en français.

Ca me pose problème puisque ça crée des faux positifs lors de la comparaison ultérieure des fichiers.

Et là, je n'ai même pas le début de l'ombre d'une piste...

ci-dessous une partie du code (je précise que je débute en programmation), auriez-vous une idée svp ?

Si vous avez des remarques elles sont également bienvenues

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import urllib.request
import time
import os
import smtplib
 
list_Nucl = ["Na-24","Sc-46","Cr-51","Mn-52","Mn-54","Co-56","Mn-56","Ni-56","Co-57","Ni-57","Co-58","Co-60","Zn-65","Ga-66","Ga-67","Y-88","Y-90","Y-90m","Nb-92","Tc-99","Mo-99","Ru-103","Cd-109"
,"Ag-110m","Te-121","I-123","I-125","I-131","I-133","Cs-134","I-135","Cs-136","Cs-137","La-140","Ce-141","Eu-152","Eu-152m","Sm-153","Ce-144","Eu-154","Eu-156","Er-169","Tb-160","Yb-169","Tm-170","Yb-175"
,"Lu-177","Re-184","Re-186","Re-188","Ir-192","Tl-200","Pb-201","Tl-201","Tl-202","Pb-203"]
 
 
for i in list_Nucl:
 
    with urllib.request.urlopen("http://www.nucleide.org/Laraweb/Results/"+ str(i)+".txt") as url:
 
        s = url.read()
 
        s = s.decode("latin-1") # décode les bytes (qui ne sont pas utf8 mais latin-1) afin d'avoir un fichier .txt plus lisible
 
 
        with open("all_data.txt", "a") as fichier: # mode d'écriture "a" pour écrire à la suite dans le fichier texte data.txt
            fichier.write(s)
 
 
os.rename("all_data.txt", time.strftime("%Y%B%d%H%M%S_all_data.txt")) # renomme le fichier data obtenu avec date et heure minute seconde