IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Urllib -> Meilleur chemin ?


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2014
    Messages
    14
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2014
    Messages : 14
    Par défaut Urllib -> Meilleur chemin ?
    Bonjour,

    J'aimerais quelques conseil sur le chemin a prendre :

    Dans le cadre de mon programme, j'ai nécessiter d’accéder a une URL et de récupérer plusieurs informations dessus, type INT,

    ces informations sont toujours précédé de la même chose (expression régulière pour les retrouver)

    Si j'ai bien saisit Urlib va récupérer le code source de la page, et la parcourir telle un objet fichier ?

    Dans ce cas, quelle méthode serait la plus judicieuse ? Merci,

  2. #2
    Expert confirmé

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 307
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 307
    Par défaut
    Salut,

    À quel niveau de ton travail se situe ta question ?

    urllib2 te retourne effectivement un texte
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    content = urllib2.urlopen(url).read()
    Tu pourras donc y faire des recherches avec des regex mais tu devras aussi t'assurer de l'encodage de cette page.

    Il existe aussi BeautifulSoup [1] qui, lui, se charge de vérifier l'encodage original de la page et te retourne de l'UTF-8.

    [1] http://www.crummy.com/software/BeautifulSoup/bs4/doc/

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2014
    Messages
    14
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2014
    Messages : 14
    Par défaut
    donc avec cette methode :
    content = urllib2.urlopen(url).read()
    "content" a l’intégralité de la page. mais il la reçoit sous quelle forme ?
    C'est du HTML classique( lurl que je vais ouvrire ) , quand je l'ouvre avec Notepad++ ( le code source de la page ) c'est tout joulie,
    il y a les saut a la ligne tout est bien formaté.

    A contrario, sur bloc note tout est cote a cote, pas de saut de ligne.

    Donc la lecture du fichier via la fonction read se fera avec le fichier formaté comment ? en mode bloc note ?

Discussions similaires

  1. Les meilleurs cours et tutoriels C++
    Par Community Management dans le forum C++
    Réponses: 1
    Dernier message: 13/05/2015, 13h50
  2. Meilleur chemin pour devenir ingénieur
    Par Sql_Katyusha dans le forum Etudes
    Réponses: 25
    Dernier message: 13/05/2011, 23h22
  3. meilleur chemin pour former une courbe spline
    Par Décembre dans le forum Algorithmes et structures de données
    Réponses: 4
    Dernier message: 02/06/2010, 23h45
  4. API des meilleurs chemins dans un graph
    Par feten dans le forum API standards et tierces
    Réponses: 2
    Dernier message: 19/09/2008, 18h35
  5. [MySQL] statistiques sur le meilleur chemin parcouru
    Par kurtalis dans le forum Langage SQL
    Réponses: 2
    Dernier message: 02/06/2006, 11h35

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo