IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

JavaScript Discussion :

Récupérer les balises headings de la page html


Sujet :

JavaScript

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2018
    Messages : 4
    Points : 1
    Points
    1
    Par défaut Récupérer les balises headings de la page html
    Bonjour,

    je dois récupérer les balises h1,h2.... d'une page et m'assurer qu'elles soient dans le bon ordre (pas de h2 avant h1 par exemple). Mon problème est que je n'arrive pas à trouver une solution pour vérifier l'ordre dans laquelle je les récupère.
    Ma tentative était de placer tous les balises que je récupère à l'aide d'un QuerySelector dans lequel je place une variable ou j'y mets la lettre h + la valeur de la boucle sauf que les valeurs qui se retrouvent dans la variable headingsset arrivent dans l'ordre de la boucle for, ce qui ne m’intéresse pas...Si vous avez des propositions, je suis preneur.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    var headingsset = [];
    for (var j = 1; j < 11; j++) {                           
    	 var hn = 'h'+ j;
    var headings = document.querySelectorAll(hn);
    for (var i = 0; i < headings.length; i++) {
    	for (var l = 1; l<11 ; l++) { 
    	var by= 'h'+(parseInt(hn.match(j).join(''))+l);
    }	
    }
    En vous souhaitant une bonne soirée,

    Alexandre

  2. #2
    Rédacteur

    Avatar de danielhagnoul
    Homme Profil pro
    Étudiant perpétuel
    Inscrit en
    Février 2009
    Messages
    6 389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant perpétuel
    Secteur : Enseignement

    Informations forums :
    Inscription : Février 2009
    Messages : 6 389
    Points : 22 933
    Points
    22 933
    Billets dans le blog
    125
    Par défaut


    Exemple ES2015+ avec commentaires

    Nota bene pour les utilisateurs de Firefox

    J'ai adopté les modules ES2015 partout, c'est tellement pratique, mais Firefox est en retard par rapport à Chrome et Edge, voir Can I use module : https://caniuse.com/#search=module.
    La sortie de Firefox 60 (normal) est prévue pour le 2018-05-09 (https://wiki.mozilla.org/RapidRelease/Calendar)

    Blog

    Sans l'analyse et la conception, la programmation est l'art d'ajouter des bogues à un fichier texte vide.
    (Louis Srygley : Without requirements or design, programming is the art of adding bugs to an empty text file.)

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2018
    Messages : 4
    Points : 1
    Points
    1
    Par défaut
    Merci pour votre réponse, je ne m'attendais pas à ce qu'elle soit sous forme d'une page web

    Je ne comprends pas vraiment l'utilité de faire plusieurs QuerySelector pour l'ensemble de la page, on ne pourrait pas s'en sortir en utilisant qu'un seul d'entre eux qui s'applique sur toute la page?

    Cordialement,

    Alexandre

  4. #4
    Membre expert
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    2 873
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2011
    Messages : 2 873
    Points : 3 717
    Points
    3 717
    Par défaut
    Salut,

    Je ne suis pas sûr de comprendre la question... Tu veux vérifier cela dans toute la page ? Mais dans une page il peut y avoir plusieurs chapitres/groupes/conteneurs et chacun d'eux peuvent avoir des balises hn..., non ?

    Citation Envoyé par MisterLSC Voir le message
    Je ne comprends pas vraiment l'utilité de faire plusieurs QuerySelector pour l'ensemble de la page, on ne pourrait pas s'en sortir en utilisant qu'un seul d'entre eux qui s'applique sur toute la page?
    Ben justement si ta page contient plusieurs chapitres/groupes/conteneurs et que chacun d'eux peuvent avoir des balises hn alors il serait plus logique de traiter chacun d'eux séparément, non ? D'où l'usage de conteneurN.querySelectorAll( "h1, h2, h3, h4, h5, h6" ) pour chaque conteneur (si j'ai bien compris)...


    PS : Pour les balises hn, n va de 1 à 6, non ? Alors pourquoi tu vas jusqu'à 11 dans tes boucles ?

  5. #5
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2018
    Messages : 4
    Points : 1
    Points
    1
    Par défaut
    Bonjour,

    J'ai vu que les hn ne sont pas censé dépasser 6 mais j'ai simplement mis un nombre au hasard en essayant de trouver une méthode qui marche sans appeler tous les hn possible

    Oui, je cherche à vérifier toute la page mais le but est de pouvoir appliquer le script à toutes les pages possibles, sans savoir comment elles seront divisées en chapitres/groupes/contenus.

  6. #6
    Membre expert
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    2 873
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2011
    Messages : 2 873
    Points : 3 717
    Points
    3 717
    Par défaut
    Ben dans ce cas il suffit d'adapter le code de Daniel, qui peut le plus peut le moins...

  7. #7
    Membre expert
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    2 873
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2011
    Messages : 2 873
    Points : 3 717
    Points
    3 717
    Par défaut
    J'ai fait un mixte de ton code avec celui de Daniel (j'ai repris le principe, l'algorithme) plus quelques touches personnelles et ça donne cette fonction :
    Code javascript : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    var headings = document.querySelectorAll("h1, h2, h3, h4, h5, h6");
    for (var i = 0, n = 0, hn; i < headings.length; i++, n = hn) {
     
      hn = +headings[i].tagName.slice(1);
      if (hn < n) {
        console.warn(i, "ordre incorrect !!! : une balise h" + hn + " après une balise h" + n);
      } else {
        if (n == 0) console.log(i, "une balise h" + hn);
        else console.log(i, "ordre correct : une balise h" + hn + " après une balise h" + n);
      }
    }

    Tu peux tester ici : http://jsbin.com/zupigekaqi/edit?html,js,console,output

  8. #8
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2018
    Messages : 4
    Points : 1
    Points
    1
    Par défaut
    Merci à tous les deux pour votre aide! J'allais justement partir sur un document.querySelectorAll (mais j'ai du aller au travail entre-temps )!

  9. #9
    Modérateur

    Avatar de NoSmoking
    Homme Profil pro
    Inscrit en
    Janvier 2011
    Messages
    16 957
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 16 957
    Points : 44 121
    Points
    44 121
    Par défaut
    Bonjour,
    il me semble que votre approche est incomplète dans le sens ou les <hx> peuvent appartenir à des conteneurs différents.

    Exemple de code conforme :
    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    <main>
      <h1>Titre principal</h1>
      <section>
        <h2>une balise h2</h2>
        <h3>une balise h3</h3>
        <h4>une autre balise h3</h4>
      </section>
      <section>
        <h2>une balise h2</h2>
        <h3>une balise h3</h3>
        <h4>une autre balise h3</h4>
      </section>
    </main>
    J'aurais plutôt une approche du type diviser pour mieux régner !

    Dans un premier temps récupération de « l'arbre » puis traitement par blocs constitués.
    Le traitement à faire va bien sûr dépendre de ce que l'on souhaite/possède comme spécification, unicité <h1>, hiérarchie, manque de continuité ...

    Pour la partie récupération j'ai eu l'occasion de me pencher sur la question, plutôt quelque chose d'approchant, et je vous livre un fichier exemple de test.
    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    <!DOCTYPE HTML>
    <html lang="fr">
    <head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Récupération « arbre » des headings</title>
    <meta name="Author" content="NoSmoking">
    <style>
    * {
      margin: 0;
    }
    html, body {
      height: 100%;
      margin: 0;
      padding: 0;
      min-height: 100%;
      font: 1em/1.5 Verdana,sans-serif;
    }
    main {
      display: block;
      margin: 0 auto;
      max-width: 60em;
    }
    header h1 {
      color: #069;
      font-size: xx-large;
    }
    .row {
      display: table-cell;
      border: none !important;
      vertical-align: top;
      width: 28em;;
    }
    h1, h2, h3, h4, h5, h6 {
      margin: 0;
      font-size: 1.5em;
    }
    section, article, div {
      margin: .5em 1em;
      padding: 0 .5em;
      border: 1px solid #CCC;
    }
    section:hover, article:hover, div:hover {
      border: 1px solid #069;
    }
    ul {
      margin: .5em 1em;
      padding-left: 1.5em;
      border: 1px solid #ABC;
      line-height: 1.5em;
    }
    button {
      line-height: 2em;
      min-width: 20em;
      font-size: inherit;
      cursor: pointer;
    }
    </style>
    </head>
    <body>
    <main>
      <header>
        <h1>Récupération « arbre » des headings</h1>
      </header>
      <div class="row">
        <div>
          <h1>Titre 1.1</h1>
          <p>Du texte ...</p>
          <h2>Titre 2.1</h2>
          <section>
            <h1>Titre 1.2</h1>
            <p>Du texte ...</p>
            <h4>Titre 4.1</h4>
            <article>
              <h5>Titre 5.1</h5>
              <p>Du texte ...</p>
            </article>
            <h3>Titre 3.1</h3>
            <p>Du texte ...</p>
          </section>
          <section>
            <h1>Titre 1.4</h1>
            Du texte ...
          </section>
        </div>
        <div>
          <h1>Titre 1.3</h1>
        </div>
      </div>
      <div class="row" id="result">
      </div>
      <button onclick="createListHeading()">createListHeading</button>
    </main>
    <script>
    var selectorHeadings = "h1,h2,h3,h4,h5,h6";
    function findListHeading(node) {
      var oHs = node.querySelectorAll(selectorHeadings);
      var i;
      var nb = oHs.length;
      var elem;
      var parent;
      var result = [];
      for (i = 0; i < nb; i += 1) {
        elem = oHs[i];
        // test si déjà traité
        if (!elem.getAttribute("flag")) {
          parent = elem.parentNode;
          // pris en compte si même parent
          if (parent === node) {
            result.push("<LI>&lt;" + elem.tagName + "&gt; " + elem.textContent);
            // marque comme traité
            elem.setAttribute("flag", "true");
          }
          // on y retourne
          else {
            result.push("<UL>" + findListHeading(parent) + "</UL>");
          }
        }
      }
      return result.join("");
    }
     
    function createListHeading() {
      // récup. de la liste
      var html = findListHeading(document.querySelector("body"));
      // affichage
      document.querySelector("#result").innerHTML = html;
      // on clear le flag
      var oElems = document.querySelectorAll("[flag]");
      Array.prototype.slice.call(oElems).map(function (elem) {
        elem.removeAttribute("flag");
      });
    }
    </script>
    </body>
    Pour la suite je verrais bien un traitement sur la liste réalisée voire modifier la récupération et travailler directement sur des objets.

  10. #10
    Modérateur

    Avatar de NoSmoking
    Homme Profil pro
    Inscrit en
    Janvier 2011
    Messages
    16 957
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 16 957
    Points : 44 121
    Points
    44 121
    Par défaut
    Je vous mets une version qui tiens compte uniquement de la hiérarchie des <hx> dans le document.
    Récupération « arbre » des headings.

    Ce document est « non conforme » mais le résultat du validateur est bien diffèrent, comme quoi il est important de bien définir ce que l'on souhaite vérifier.

    [Edit] correction lien foireux !

  11. #11
    Membre expert
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    2 873
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2011
    Messages : 2 873
    Points : 3 717
    Points
    3 717
    Par défaut
    Merci NoSmoking, je vais regarder ça...

    Citation Envoyé par NoSmoking Voir le message
    Bonjour,
    il me semble que votre approche est incomplète dans le sens ou les <hx> peuvent appartenir à des conteneurs différents.
    Ben oui c'est ce qui me semblait aussi c'est pourquoi je disais plus haut :

    Citation Envoyé par Beginner. Voir le message
    ...

    Je ne suis pas sûr de comprendre la question... Tu veux vérifier cela dans toute la page ? Mais dans une page il peut y avoir plusieurs chapitres/groupes/conteneurs et chacun d'eux peuvent avoir des balises hn..., non ?

    Ben justement si ta page contient plusieurs chapitres/groupes/conteneurs et que chacun d'eux peuvent avoir des balises hn alors il serait plus logique de traiter chacun d'eux séparément, non ? D'où l'usage de conteneurN.querySelectorAll( "h1, h2, h3, h4, h5, h6" ) pour chaque conteneur (si j'ai bien compris)...

  12. #12
    Rédacteur

    Avatar de danielhagnoul
    Homme Profil pro
    Étudiant perpétuel
    Inscrit en
    Février 2009
    Messages
    6 389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant perpétuel
    Secteur : Enseignement

    Informations forums :
    Inscription : Février 2009
    Messages : 6 389
    Points : 22 933
    Points
    22 933
    Billets dans le blog
    125
    Par défaut
    Citation Envoyé par NoSmoking Voir le message
    [...]il me semble que votre approche est incomplète dans le sens ou les <hx> peuvent appartenir à des conteneurs différents.
    J'en ai bien entendu tenu compte dans mon exemple, mais cette approche ne "lui plaît pas" !

    Merci pour votre réponse, je ne m'attendais pas à ce qu'elle soit sous forme d'une page web

    Je ne comprends pas vraiment l'utilité de faire plusieurs QuerySelector pour l'ensemble de la page, on ne pourrait pas s'en sortir en utilisant qu'un seul d'entre eux qui s'applique sur toute la page?

    Cordialement,

    Alexandre

    Blog

    Sans l'analyse et la conception, la programmation est l'art d'ajouter des bogues à un fichier texte vide.
    (Louis Srygley : Without requirements or design, programming is the art of adding bugs to an empty text file.)

  13. #13
    Modérateur

    Avatar de NoSmoking
    Homme Profil pro
    Inscrit en
    Janvier 2011
    Messages
    16 957
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 16 957
    Points : 44 121
    Points
    44 121
    Par défaut
    Oui c'est vrai mais quand il dit (que ne n'avais pas lu )
    Je ne comprends pas vraiment l'utilité de faire plusieurs QuerySelector pour l'ensemble de la page, on ne pourrait pas s'en sortir en utilisant qu'un seul d'entre eux qui s'applique sur toute la page?
    il a raison dans le sens où l'on pourrait récupérer une bonne fois tous les <hx> et les parcourir.

    Ce n'est pas l'option non plus que j'ai prise, par flemmardise, et je relance la recherche à chaque entrée dans la fonction en ciblant le parent.

Discussions similaires

  1. Réponses: 6
    Dernier message: 17/01/2017, 22h38
  2. Balise script dans le head de la page html
    Par binouzzz19 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 1
    Dernier message: 08/07/2010, 09h30
  3. [RegEx] Extraire le code entre les balises <body> d'une page html
    Par abousa3d dans le forum Langage
    Réponses: 5
    Dernier message: 19/05/2010, 10h35
  4. [XML] HTML dns XML -> Récupérer les balises intérprétées comme du XML
    Par dacid dans le forum Bibliothèques et frameworks
    Réponses: 0
    Dernier message: 16/04/2010, 17h59
  5. Réponses: 7
    Dernier message: 09/03/2009, 20h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo