IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB.NET Discussion :

Extraire données précises d'un html


Sujet :

VB.NET

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    477
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2006
    Messages : 477
    Par défaut Extraire données précises d'un html
    Bonjour à vous tous et merci d'avance pour votre précieuse aide.
    Je souhaiterais récupére des données d'une source hmtl.

    J'ai donc crée un WebBrowser1 et un RichTextBox1

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    WebBrowser1.Navigate("http://...")
    contenuHTML = WebBrowser1.DocumentText.ToString
    RichTextBox1.Text = contenuHTML
    La source affiché dans mon RichTextBox1
    Je souhaiterais extraire tout les données qui sont en rouge ci-dessous.
    Les données en vert se répete dans la source html donc je sais exactement où se trouve les données dont j'ai besoin.

    Exemple:
    class="SubTD"><br />Nom</a>

    Ensuite
    (200C)<br />3 Rue des Ponts 59800 LILLE</span>

    Ensuite je dois séparer le numéro, l'adresse, le code postale et la ville.
    Mais pour ça je vais essayer de me débrouiller seul dans un 1er temps.

    Encore merci à vous.

  2. #2
    Membre chevronné Avatar de roster
    Profil pro
    Inscrit en
    Décembre 2008
    Messages
    397
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2008
    Messages : 397
    Par défaut
    Qu'un seul mot: REGEX! (Ha,,, et google...)

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    477
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2006
    Messages : 477
    Par défaut
    C'est un programme payant.
    De plus, ce que je vouderais, c'est faire de la programmation.


    Merci de ton aide

  4. #4
    Membre chevronné Avatar de roster
    Profil pro
    Inscrit en
    Décembre 2008
    Messages
    397
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2008
    Messages : 397
    Par défaut
    Regex pour expression régulières.

    http://lgmorand.developpez.com/dotnet/regex/

  5. #5
    Membre éclairé
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    477
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2006
    Messages : 477
    Par défaut
    Effectivement c'est plus claire, car j'avais tapé sur google comme tu me l'avais demande et je suis tombé sur un site avec des programmes.

    Alors j'ai parcourus le tutoriel que tu ma proposé, j'ai ensuite consulter quelques post sur le forum.

    Et je suis arrivé à ce code qui me sert d'apprentissage (j'ai jamais utlisé cela avant)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    Dim r As New Regex("^(y | z)$")
            Dim m As Match
            m = r.Match("Bonjour yBonjourz")
            Dim Result As String
            If m.Success Then
                Result = m.Groups(1).ToString
            End If
     
            MessageBox.Show("Groupe: " + m.Groups(1).Value)
    Donc j'aimerais extraire ce qui se trouve en y et z, donc Bonjour
    Je n'ai aucune erreur, mais mon messageBox me donne rien.

    merci à toi encore une fois.

  6. #6
    Membre éclairé
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    477
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2006
    Messages : 477
    Par défaut
    J'ai réussi avec cette syntaxe, le probléme est que:
    Si cela contient un espacement ou un chiffre cela ne marche plus

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
     
    Dim r As New Regex("^class=""soustitre""><br />([\w]+)</a>")
            Dim m As Match
            m = r.Match("class=""soustitre""><br />ADDPOINTSCHAUDS</a>")
     
            If m.Success Then
                MessageBox.Show("Résultat: " + m.Groups(1).Value)
     
            End If
    Merci de ton aide

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 3
    Dernier message: 14/01/2010, 22h30
  2. Extraire certaines données d'un fichier HTML
    Par Sancti_Eyes dans le forum Langage
    Réponses: 4
    Dernier message: 06/08/2009, 13h52
  3. Réponses: 2
    Dernier message: 06/04/2009, 16h44
  4. [RegEx] Comment extraire des données d'une page HTML ?
    Par taliesin26 dans le forum Langage
    Réponses: 1
    Dernier message: 11/12/2006, 12h39
  5. extraire des données d'un code HTML
    Par blueice dans le forum Langage
    Réponses: 5
    Dernier message: 19/08/2004, 19h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo