IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB.NET Discussion :

Parser page HTML en VB avec HtmlAgilityPack [Débutant]


Sujet :

VB.NET

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Février 2019
    Messages : 6
    Par défaut Parser page HTML en VB avec HtmlAgilityPack
    Bonjour a tous ,

    Je me suis lancé dans le VB très récemment,
    Je cherche a récupérer des informations présentes dans le tableau d'une page web avec HTMLAgilityPack. J'ai pour le moment déjà réussi a récupérer des informations de la page mais aucunes provenant de ce tableau.

    Je vous poste ci dessous une impression d’écran de la page en question
    Nom : 1.png
Affichages : 520
Taille : 33,8 Ko

    Je cherche a recupérer la valeur de 'pptEV'

    Voici mon code : ( tout ce qui a de plus basiques )

    J'ai essayé de multiple manière de mis prendre et je reçois a chaque fois une valeur 'null'


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
     
    Private Sub Button3_Click(sender As Object, e As EventArgs) Handles Button3.Click
     
            Dim web As New HtmlWeb()
            Dim url As String = "XXXXXXXXXX"
            Dim doc As HtmlDocument = web.Load(url)
     
            Dim div As HtmlNode = doc.DocumentNode.SelecSingleNode("/html/body/div/table/tr[1]/td[1]")
    		'link.GetAttributeValue("//td[@id='pptEV']", "null")
    		'Dim div As HtmlNode = doc.DocumentNode.SelectSingleNode("//td[@id='pptEV']")
            If Not div Is Nothing Then
                Label33.Text = "Recherche DIV : KO"
            End If
     
            Dim pptEVIndidcatorValue = div.InnerText 
     
            TextBox1.Text = pptEVIndidcatorValue
     
     
     
        End Sub
    Merci d'avance

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Avril 2013
    Messages
    98
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2013
    Messages : 98
    Par défaut
    Tu peux essayer de passer en revue les lignes et selectionner celle qui commence par <td class='pptEV'>, et utiliser .replace pour <td class='pptEV'> et </td>
    C'est un peu barbare mais ça devrais fonctionner en théorie ^^ Ou alors mieux regarder HTMLAglityPack

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Février 2019
    Messages : 6
    Par défaut
    Merci pour ta réponse
    Je comprend le principe , mais je ne vois pas comment le mettre en application . Tu as des idées ?
    Ça devrais du coup rendre la recherche plus lente non ?

    J’ai toujours pas réussi à parser cette page html, vous avez des idées ?

    Je pense que je ne pointe pas correctement les infos que je cherche dans le tableau de la page HTML.

  4. #4
    Modérateur
    Avatar de DotNetMatt
    Homme Profil pro
    CTO
    Inscrit en
    Février 2010
    Messages
    3 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : CTO
    Secteur : Finance

    Informations forums :
    Inscription : Février 2010
    Messages : 3 611
    Billets dans le blog
    3
    Par défaut
    Tu peux utiliser la function contains de XPATH : ...SelectSingleNode("//tr/td[contains(@class,'pptEV')]").
    Less Is More
    Pensez à utiliser les boutons , et les balises code
    Desole pour l'absence d'accents, clavier US oblige
    Celui qui pense qu'un professionnel coute cher n'a aucune idee de ce que peut lui couter un incompetent.

  5. #5
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Février 2019
    Messages : 6
    Par défaut
    Un Grand merci a toi , ça a fonctionné !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Peut on générer des pages HTML en pdf avec jQuery
    Par pierrot10 dans le forum jQuery
    Réponses: 11
    Dernier message: 25/03/2011, 16h30
  2. Réponses: 7
    Dernier message: 19/03/2010, 16h31
  3. Réponses: 4
    Dernier message: 12/10/2007, 09h14
  4. Réponses: 1
    Dernier message: 22/08/2007, 15h40
  5. Réponses: 1
    Dernier message: 20/08/2007, 21h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo