Enregistrer le texte d'une page HTML avec Selenium
bonjour,
j'ai trouvé ce code qui enregistre uniquement le texte d'une page html :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13
| from requests import get
response = get("https://fr.wikipedia.org/wiki/Wiki")
soup = BS(response.content, "html.parser")
for child in soup.body.children:
if child.name == 'script':
child.decompose()
myText = soup.body.get_text()
f1=open("maPage.html","w",encoding="utf-8-sig")
f1.write(str(myText))
f1.close() |
Lorsque j'utilise selenium, j'enregistre la page comme ceci après y avoir accéder :
Code:
1 2 3 4
| html = driver.page_source
f1=open("maPage.html","w",encoding="utf-8-sig")
f1.write(str(html))
f1.close() |
Pourriez-vous me dire, svp, comment faire pour enregistrer uniquement le texte de la page comme dans le code ci-dessus?
Je vous remercie d'avance.
Arsène