IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement Web avec .NET Discussion :

tableau html + Html Agility Pack


Sujet :

Développement Web avec .NET

  1. #1
    Membre du Club
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Mars 2011
    Messages
    104
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2011
    Messages : 104
    Points : 53
    Points
    53
    Par défaut tableau html + Html Agility Pack
    Bonjour,

    S.V.P est ce que vous une idée comment je peut récupérer le contenu d'un tableau html avec Html Agility Pack et C#.


    Merci pour votre aide.

  2. #2
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    Sans avoir plus de détails, c'est difficile de te donner une réponse précise... Il faudrait connaitre la structure de la page où tu veux récupérer ce tableau. Est-ce que c'est le seul tableau, ou est-ce qu'il y en a plusieurs ? Est-ce que le tableau a une caractéristique qui permet de le retrouver facilement (attribut id ou class par exemple) ?

  3. #3
    Membre du Club
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Mars 2011
    Messages
    104
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2011
    Messages : 104
    Points : 53
    Points
    53
    Par défaut
    merci pour votre aide, il existe un seul tableau dans la page ci dessous un exemple de tableau.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
     
    <table border="1" cellspacing="0" cellpadding="2" bordercolor=
     
    "#808080" width="652">
     
    <tr>
     
    <td>
     
    <p align="justify">&nbsp;<b>DECLARANT&nbsp;</b>:<br />
     
    <br />
     
    Personne physique liée à Louis PETIET, Administrateur</p>
     
    </td>
     
    </tr>
     
    <tr>
     
    <td>
     
    <p><br />
     
    <b>INSTRUMENT FINANCIER</b>&nbsp;: Actions<br />
     
    &nbsp;</p>
     
    </td>
     
    </tr>
    </table>
    Merci.

  4. #4
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    Pour récupérer le tableau, tu peux faire quelque chose comme ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    WebClient wc = new WebClient();
    HtmlDocument doc = new HtmlDocument();
    using (Stream stream = wc.OpenRead(url))
    {
        doc.Load(stream);
    }
    HtmlNode table = doc.DocumentNode.Descendants("table").First();
    Une fois que tu as le tableau, tu peux parcourir chaque cellule de chaque ligne :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    // Lignes
    var rows = table.Elements("tr");
    foreach (var row in rows)
    {
        // Cellules
        var cells = row.Elements("td");
        foreach (var cell in cells)
        {
            // Texte d'une cellule
            string text = cell.InnerText;
            ...
        }
    }

  5. #5
    Membre éprouvé Avatar de yonpo
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Mars 2010
    Messages
    617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2010
    Messages : 617
    Points : 947
    Points
    947
    Par défaut
    Salut,

    Petite correction :
    Code c# : Sélectionner tout - Visualiser dans une fenêtre à part
    HtmlNode table = doc.DocumentNode.Descendants("table").First();

  6. #6
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    Citation Envoyé par yonpo Voir le message
    Salut,

    Petite correction :
    Code c# : Sélectionner tout - Visualiser dans une fenêtre à part
    HtmlNode table = doc.DocumentNode.Descendants("table").First();
    Exact... c'est corrigé, merci

  7. #7
    Membre du Club
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Mars 2011
    Messages
    104
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2011
    Messages : 104
    Points : 53
    Points
    53
    Par défaut
    Bonjour,

    merci pour pour vos réponse mais SVP une autre question si je vais utiliser le xpath ou je doit le remplacer le xpath dans le bous du code ci dessous? et ce que je doit mettre le xpath du tableau et du tr , td ?

    Merci

  8. #8
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    Citation Envoyé par aymen8219 Voir le message
    merci pour pour vos réponse mais SVP une autre question si je vais utiliser le xpath ou je doit le remplacer le xpath dans le bous du code ci dessous? et ce que je doit mettre le xpath du tableau et du tr , td ?
    Aucune idée, je suis super nul en XPath
    Pourquoi veux-tu utiliser XPath ? Avec la solution que je t'ai donnée, ce n'est pas nécessaire...

  9. #9
    Expert confirmé Avatar de DonQuiche
    Inscrit en
    Septembre 2010
    Messages
    2 741
    Détails du profil
    Informations forums :
    Inscription : Septembre 2010
    Messages : 2 741
    Points : 5 485
    Points
    5 485
    Par défaut
    Citation Envoyé par aymen8219 Voir le message
    Bonjour,

    merci pour pour vos réponse mais SVP une autre question si je vais utiliser le xpath ou je doit le remplacer le xpath dans le bous du code ci dessous? et ce que je doit mettre le xpath du tableau et du tr , td ?

    Merci
    Voici deux exemples utilisant XPath pour directement récupérer toutes les cellules.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    var cells = doc.DocumentNode.SelectNodes("//table/tr/td");
    var cells = doc.DocumentNode.SelectNodes("//td");
    Mais pour l'anecdote, simplement spécifier "table" c'était déjà utiliser XPath.

    PS : Le W3C a un super tuto très court en ligne pour XPath, ça se trouve vite avec Google.

  10. #10
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    Citation Envoyé par DonQuiche Voir le message
    PS : Le W3C a un super tuto très court en ligne pour XPath, ça se trouve vite avec Google.
    Je suppose que tu parles plutôt de W3Schools
    http://www.w3schools.com/xpath/

  11. #11
    Expert confirmé Avatar de DonQuiche
    Inscrit en
    Septembre 2010
    Messages
    2 741
    Détails du profil
    Informations forums :
    Inscription : Septembre 2010
    Messages : 2 741
    Points : 5 485
    Points
    5 485
    Par défaut
    Citation Envoyé par tomlev Voir le message
    Je suppose que tu parles plutôt de W3Schools
    http://www.w3schools.com/xpath/
    Oups, oui, tu as raison, merci.

  12. #12
    Membre du Club
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Mars 2011
    Messages
    104
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2011
    Messages : 104
    Points : 53
    Points
    53
    Par défaut
    bonjour,

    merci pour vos réponse, je viens d’écrire ce bous de code et j'ai mis le chemin de xpath de mon tableau mais j'ai toujours le problème ce message
    NullReferenceException was unhandlled

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
     HtmlAgilityPack.HtmlWeb web = new HtmlWeb();
                HtmlAgilityPack.HtmlDocument doc = web.Load("http://www.amf-france.org/inetbdif/viewdoc/affiche.aspx?id=72670&txtsch=");
                foreach (HtmlNode table in doc.DocumentNode.SelectNodes("/html/body/table[2]"))
                {
                    Console.WriteLine("Found: " + table.Id);
                    foreach (HtmlNode row in table.SelectNodes("tr"))
                    {
                        Console.WriteLine("row");
                        foreach (HtmlNode cell in row.SelectNodes("th|td"))
                        {
                            Console.WriteLine("cell: " + cell.InnerText) ;
     
                        }
                    }
                }
                System.Console.ReadKey();

    Merci pour votre aide

  13. #13
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 749
    Points
    39 749
    Par défaut
    C'est parce que ta requête XPath ne renvoie rien...

    D'ailleurs, la page que tu récupères utilise des frames (visiblement l'AMF vit encore dans les années 90 ), donc les données que tu cherches ne sont pas directement à cette URL. Il faut récupérer l'URL de la frame qui t'intéresse, et la charger dans un autre HtmlDocument.

    D'autre part, pour récupérer la table, tu devrais utiliser SelectSingleNode et non SelectNodes, puisque tu ne cherches qu'un seul élément

    Voilà une version modifiée de ton code qui fonctionne :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
                var web = new HtmlWeb();
                var doc = web.Load("http://www.amf-france.org/inetbdif/viewdoc/affiche.aspx?id=72670&txtsch=");
                var frame = doc.DocumentNode.SelectSingleNode("/html/frameset/frame[@id='viewdoc']");
                string newUrl = frame.Attributes["src"].Value;
                doc = web.Load(newUrl);
                var table = doc.DocumentNode.SelectSingleNode("/html/body/table[2]");
                Console.WriteLine("Found: " + table.Id);
                foreach (HtmlNode row in table.SelectNodes("tr"))
                {
                    Console.WriteLine("row");
                    foreach (HtmlNode cell in row.SelectNodes("th|td"))
                    {
                        Console.WriteLine("cell: " + cell.InnerText);
                    }
                }
                Console.ReadKey();

Discussions similaires

  1. Extraction de données de pages web à l'aide de HTML Agility Pack
    Par tomlev dans le forum Général Dotnet
    Réponses: 45
    Dernier message: 07/10/2015, 21h04
  2. C# Html Agility Pack fait planter le programme
    Par pascal4435 dans le forum C#
    Réponses: 7
    Dernier message: 01/03/2013, 13h55
  3. extraire html propiété value (html agility pack)
    Par jalalnet dans le forum VB.NET
    Réponses: 0
    Dernier message: 07/05/2012, 12h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo