IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

parser des urls


Sujet :

C++

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    28
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 28
    Par défaut parser des urls
    bonjour,

    J'ai télécharger la source d'une page de resultats google.
    J'ai mis cette source dans un string.

    J'aimerai maintenant extraire les url :

    les urls des sites sont entourées par les balise <h2 class=r> mais je ne sais pas trop comment faire en c++ pour extraire toute ses url et les mettre dans un veteur de string ou autre.

    exemple de source google :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    ..... du texte html....
    <h2 class=r><a href="http://fr.wikipedia.org/wiki/Chien" class=l onmousedown="return clk(this.href,'','','res','3','')"><b>Chien</b> - Wikipédia</a></h2>
     
    ..... du texte html....
    Si quelqu'un a une piste pour m'aider, merci d'avance.

  2. #2
    Membre éprouvé
    Avatar de NiamorH
    Inscrit en
    Juin 2002
    Messages
    1 309
    Détails du profil
    Informations forums :
    Inscription : Juin 2002
    Messages : 1 309
    Par défaut
    Salut,
    soit précis, ce que tu veux récupérer c'est :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <a href="http://fr.wikipedia.org/wiki/Chien" class=l onmousedown="return clk(this.href,'','','res','3','')"><b>Chien</b> - Wikipédia</a>
    ou :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    http://fr.wikipedia.org/wiki/Chien
    Dans tous les cas, il suffit de se servir des méthodes find et substr de std::string pour obtenir un résultat. Tu trouveras de la doc un peu partout sur le net.

  3. #3
    Alp
    Alp est déconnecté
    Expert confirmé

    Avatar de Alp
    Homme Profil pro
    Inscrit en
    Juin 2005
    Messages
    8 575
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Juin 2005
    Messages : 8 575
    Par défaut
    Il existe aussi des libs de parsing de xml, ou des libs de manipulation de chaînes de caractères.

    Il est important de comprendre comment ça marche, donc de faire soi-même. Mais il est aussi important de ne pas trop s'attarder dessus et d'avoir un code qui ne perd pas de temps lui non-plus (à l'exécution).

  4. #4
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Par défaut
    Une question bête : Une page générée par google est une page concue pour être lue par un humain, et qui contient plein de garbage. Google n'exposte-il pas un web service qui permettrait de récupérer directement la bonne information dans un format convenable ?
    Ma session aux Microsoft TechDays 2013 : Développer en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage à la découverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'hésitez pas à me contacter.

Discussions similaires

  1. [Référencement] Pourquoi des URL longues et explicites ?
    Par bibile dans le forum Référencement
    Réponses: 19
    Dernier message: 09/12/2005, 15h09
  2. Parser une URL
    Par pekka77 dans le forum Général JavaScript
    Réponses: 2
    Dernier message: 18/11/2005, 12h34
  3. Réponses: 2
    Dernier message: 04/08/2005, 21h37
  4. parser des fichier .xml en perl
    Par djibril dans le forum Modules
    Réponses: 13
    Dernier message: 18/05/2004, 17h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo