IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques et frameworks PHP Discussion :

[DOM] Extraire du contenu HTML avec Xpath


Sujet :

Bibliothèques et frameworks PHP

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2006
    Messages : 20
    Points : 20
    Points
    20
    Par défaut [DOM] Extraire du contenu HTML avec Xpath
    Bonjour,

    Je suis entrain de développer une fonction qui devra extraire une partie d'un document HTML.

    J'utilise le chemin Xpath pour bien spécifier la partie à extraire.

    Pour le moment, j'utilise ce code:

    Code PHP :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    $dom = new DOMDocument();
    @$dom->loadHTMLFile("http://www.site.com");
    $x = new DOMXPath($dom);
    $nodeList = $x->query("/html/body/p");
     
     for ($i = 0; $i < $nodeList->length; ++$i) {
            echo $domnodelist->item($i)->nodeValue;
        }

    Le problème est que ça ne m'affiche que du texte sans les balises HTML.

    Merci d'avance pour votre aide.

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut
    J'ai le même soucis... comment faire ?
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

  3. #3
    Expert éminent sénior

    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    7 920
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 7 920
    Points : 10 726
    Points
    10 726
    Par défaut
    c'est le innerHTML que vous voulez ?

  4. #4
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut
    Citation Envoyé par stealth35 Voir le message
    c'est le innerHTML que vous voulez ?

    hello, le innerHTML c'est l'équivalent du nodeValue il me semble. En fait je voudrais récupérer exactement le nodeValue mais avec les balises html que mon item() contient. Je ne vois pas comment faire ?
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

  5. #5
    Expert éminent sénior

    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    7 920
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 7 920
    Points : 10 726
    Points
    10 726
    Par défaut
    Citation Envoyé par 123quatre Voir le message
    hello, le innerHTML c'est l'équivalent du nodeValue il me semble. En fait je voudrais récupérer exactement le nodeValue mais avec les balises html que mon item() contient. Je ne vois pas comment faire ?
    non le nodeValue c'est pas la même chose, puisque y'a pas les balises

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    $doc = new DOMDocument();
    $doc->loadHTML($source);
     
    $xpath = new DOMXPath($doc);
    $query = $xpath->query('/html/body/p');
     
    foreach($query as $node)
    {
        $out = new DOMDocument();
     
        foreach($node->childNodes as $child)
        {
            $inner = $out->importNode($child, true);
            $out->appendChild($inner);
        }
     
        echo $out->saveHTML();
    }

  6. #6
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut
    Citation Envoyé par stealth35 Voir le message
    non le nodeValue c'est pas la même chose, puisque y'a pas les balises

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    $doc = new DOMDocument();
    $doc->loadHTML($source);
     
    $xpath = new DOMXPath($doc);
    $query = $xpath->query('/html/body/p');
     
    foreach($query as $node)
    {
        $out = new DOMDocument();
     
        foreach($node->childNodes as $child)
        {
            $inner = $out->importNode($child, true);
            $out->appendChild($inner);
        }
     
        echo $out->saveHTML();
    }

    merci pour ta réponse, je viens de tester ton bout de code avec
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $source='http://www.developpez.com/'
    , le echo me renvoit:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    http://www.developpez.com/
    je comprends pas....
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

  7. #7
    Expert éminent sénior

    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    7 920
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 7 920
    Points : 10 726
    Points
    10 726
    Par défaut
    loadHTMLFile pour lire un fichier

  8. #8
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut
    Citation Envoyé par stealth35 Voir le message
    loadHTMLFile pour lire un fichier
    En effet Alors voilà le code final quelque peu modifié, dans cet exemple je récupère le menu principale de developpez.com:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
     
      $doc = new DOMDocument();
      @$doc->loadHTML(file_get_contents('http://www.developpez.com/'));
     
      $xpath = new DOMXPath($doc);
      $query = $xpath->query("/html/body/div[@id='layout']/div[@id='gabarit']/div[@id='gabarit_tabmenu']/ul[@id='tabs']");
     
      foreach($query as $node)
      {
          $out = new DOMDocument();
     
          foreach($node->childNodes as $child)
          {
              $inner = $out->importNode($child, true);
              $out->appendChild($inner);
          }
     
          echo $out->saveHTML();
      }
    @stealth35: Merci beaucoup pour ton aide
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

  9. #9
    Expert éminent sénior

    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    7 920
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 7 920
    Points : 10 726
    Points
    10 726
    Par défaut
    t'es pas obligé de faire tout le chemin,
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    query("//ul[@id='tabs']")

  10. #10
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut
    Citation Envoyé par stealth35 Voir le message
    t'es pas obligé de faire tout le chemin,
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    query("//ul[@id='tabs']")
    +1
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

Discussions similaires

  1. [PHP 7] Probleme de positon de bloc html avec xpath
    Par misakilou dans le forum Langage
    Réponses: 0
    Dernier message: 17/05/2017, 15h34
  2. Extraire données Canvas HTML avec PYTHON
    Par Okahiro dans le forum Général Python
    Réponses: 1
    Dernier message: 29/03/2016, 08h20
  3. [DOM] Parcours de fichier html avec DOM en PHP
    Par zou_salim dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 08/03/2014, 16h36
  4. [PHP 5.3] Extraire une page html avec les accents
    Par JWysiwyg dans le forum Langage
    Réponses: 2
    Dernier message: 16/12/2010, 15h13
  5. recuperer un contenu HTML avec PL/SQL
    Par Grybukas dans le forum PL/SQL
    Réponses: 6
    Dernier message: 12/04/2009, 10h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo