Holé,

Voici un petit script qui va parcourir une page et extraire les adresses email:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
import urllib
 
htmlSource = urllib.urlopen("http://the-url.com/").read(200000)
for chunk in htmlSource.lower().split('href="mailto:')[1:]:
    indexes = [i for i in [chunk.find('"',1),chunk.find('>'),chunk.find(' ')] if i>-1]
    print chunk[:min(indexes)]
au lieu du print, comment l'inscrire dans un fichier, en mettant les adresses sur une seule ligne, séparées par des virgules?

c'est la fonction open?

++