Holé,
Voici un petit script qui va parcourir une page et extraire les adresses email:
au lieu du print, comment l'inscrire dans un fichier, en mettant les adresses sur une seule ligne, séparées par des virgules?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 import urllib htmlSource = urllib.urlopen("http://the-url.com/").read(200000) for chunk in htmlSource.lower().split('href="mailto:')[1:]: indexes = [i for i in [chunk.find('"',1),chunk.find('>'),chunk.find(' ')] if i>-1] print chunk[:min(indexes)]
c'est la fonction open?
++
Partager