Enregistrer le souce code d'une page web
Bonjour,
J'utiliser python 2.7.6, sur Linux Ubuntu 14.04 x64, mon navigateur est mozilla.
Je voudrais récupérer le code source de mon profile Facebook
j'ai fait ceci :
Code:
1 2 3 4 5 6 7 8 9 10 11 12
|
#!/usr/bin/python
url = "https://www.facebook.com/profile.php?id=10001319xxxxxxx"
print url
import urllib
page=urllib.urlopen(url)
Code_Source_Page_Web = strpage=page.read()
print Code_Source_Page_Web
fichier = open("Facedebook.txt", "a")
fichier.write(Code_Source_Page_Web)
fichier.close() |
le fichier est bien créé et enregistré, le problème est lorsque j'ouvre le fichier avec un éditeur de texte (kate) j'ai ce message :
Le fichier /media/laurent/50D3626024AEF9F9/partage-entre-pc/laurent/python/pyfacedebook/Facedebook.txt a été ouvert et contenait des lignes plus longues que la limite
Code:
1 2
| spécifiée de longueur de ligne (4 096 caractères).
Ces lignes ont été tronquées et le document est passé en mode lecture seule car l'enregistrement modifie son contenu. |
est dans le fichier je ne trouve pas le mot suivant
Code:
InitialChatFriendsList
qui indique les ID après ce mot.
Pour afficher le source code avec mozilla url : view-source:https://www.facebook.com/profile.php?id=10001319xxxxxxx
Comment puis-je faire ?
Merci.