bonjour,
j'ai trouvé ce code qui enregistre uniquement le texte d'une page html :
Lorsque j'utilise selenium, j'enregistre la page comme ceci après y avoir accéder :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 from requests import get response = get("https://fr.wikipedia.org/wiki/Wiki") soup = BS(response.content, "html.parser") for child in soup.body.children: if child.name == 'script': child.decompose() myText = soup.body.get_text() f1=open("maPage.html","w",encoding="utf-8-sig") f1.write(str(myText)) f1.close()
Pourriez-vous me dire, svp, comment faire pour enregistrer uniquement le texte de la page comme dans le code ci-dessus?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 html = driver.page_source f1=open("maPage.html","w",encoding="utf-8-sig") f1.write(str(html)) f1.close()
Je vous remercie d'avance.
Arsène
Partager