Bonjour,
Je souhaiterais à partir d'un fichier HTML, extraire tout le texte qui existe sur la page. Est-ce qu il y a des algos, des fonctions que vous me conseillez pour faire cela?
A titre d'exemeple, si j'ai :Et après, mettre dans un fichier :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 <head> <title> mon site </title></head> <body> ok </body>
mon site
ok
Je pensais essayer de détecter tous les textes entre "> < ". Est-ce une bonne idée?
Partager