IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

JavaScript Discussion :

pdf tables des matières


Sujet :

JavaScript

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 12
    Points : 8
    Points
    8
    Par défaut pdf tables des matières
    Bonjour à tous,

    Je convertis une page HTML en PDF avec acrobat X pro
    et je crée la table des matières (index, bookmark ou signets)
    en utilisant les titres de la page HTML selon les balises de <h1> à <h3>.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    <body>       
           <h1>Groupe I</h1>
            <h2>Sous-groupe A</h2>
             <h3>espèce 1</h3>
             <h3>espèce 2</h3>
            <h2>Sous-groupe B</h2>
             <h3>espèce 3</h3>
             <h3>espèce 4</h3>   
           <h1>Groupe II</h1>
            <h2>Sous-groupe B</h2>
             <h3>espèce 5</h3>  
       </body>
    Mon problème est que tout les titres sont au même niveau
    dans l'index du PDF généré quelque soit la version Acrobat pro



    Au lieu de la cascade des titres souhaitée
    selon leur niveau de <h1> à <h3>:
    - Groupe I
    -- Sous-groupe A
    --- espèce 1
    --- espèce 2
    ...

    Je recherche donc un script javascript pour automatiser
    cette création de table des matières avec les niveaux selon <h1> à <h3>.
    A moins qu'il existe un freeware convertisseur html en pdf avec création d'index tenant compte des balises html <h1> à <h3>.
    Le document Pdf comporte plus de 1.500 signets donc l'option manuel n'est pas envisageable.
    L'application concerne les 1.345 fiches d'espèces sous-marines du site www.souslesmers.fr.
    Merci de votre aide

    Ci-joint un exemple HTML pour le test.
    Fichiers attachés Fichiers attachés

  2. #2
    Futur Membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 12
    Points : 8
    Points
    8
    Par défaut
    Voici un extrait d'acrobatJSguide qui montre comment créer un bookmark avec des niveaux sous acrobat pro
    mais je ne sais pas comment y intégrer les titres du doc pdf selon les balises <h1> à <h3>.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    var myRoot = this.bookmarkRoot;
    myRoot.createChild("A");
    myRoot.createChild({cName: "B", nIndex: 1});
    myRoot.createChild({cName: "C", nIndex: 2});
    for (var i = 0; i < myRoot.children.length; i++) {
    var child = myRoot.children[i];
    for (var j = 0; j < 3; j++) {
    var name = child.name + j;
    child.createChild({cName: name, nIndex: j});
    }
    }
    Par avance merci de votre aide

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 12
    Points : 8
    Points
    8
    Par défaut Table des matières HTML
    Pour imager mon objectif, voici un exemple d'une table avec la hierarchie selon les balises de titre HTML <h1> à <h3> :



    En cherchant bien, j'ai trouvé un script qui peut être une base pour réaliser cette table des matières sous Acrobat pro :
    http://giminik.developpez.com/articl...-des-matieres/

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    216
    217
    218
    219
    220
    221
    222
    223
    224
    225
    226
    227
    228
    229
    230
    231
    232
    233
    234
    235
    236
    237
    238
    239
    240
    241
    242
    243
    244
    245
    246
    247
    248
    249
    250
    251
    252
    253
    254
    255
    256
    257
    258
    259
    260
    261
    262
    263
    264
    265
    <script type="text/javascript">
     
      /*
       * Script table des matières. Ce script est publié sous licence GPL
       * article : http://giminik.developpez.com/articles/javascript-dom/table-des-matieres/
       * date : 2005-09-14
       * http://www.gnu.org/copyleft/gpl.html
       * Vous pouvez le modifier librement et le redistribuer.
       * Merci de m'indiquer tout bug, incompatibilité, amélioration 
       * à giminik   at   redaction-developpez.com
       */
     
      /* Cette fonction permet d'afficher/cacher le contenu d'un élément dont on
       * connaît l'identifiant : containerId. Ici, on s'en sert pour cacher la 
       * liste de liens. En même temps, le nom de classe de l'élément titre de
       * la liste est modifié afin de pouvoir lui affecter un style CSS.
       * containerId : l'identifiant de l'élément html à afficher cacher.
       * classOpened : le nom de la classe à donner à l'élément html lorsqu'il est
       *               affiché.
       * classClosed : le nom de la classe à donner à l'élément html lorsqu'il est 
       *               caché.
       */ 
      function TCSwap(containerId, classOpened, classClosed) {
     
        var linkList = document.getElementById(containerId).lastChild;
        var listTitle = document.getElementById(containerId).firstChild;
     
        if (linkList.style.display != 'none') {
     
          linkList.style.display = 'none';
     
          listTitle.className = classClosed;
     
        }
        else if (linkList.style.display != 'block') {
     
          linkList.style.display = 'block';
     
          listTitle.className = classOpened;
     
        }
     
      }
     
     
      /* Cette fonction génère la table des matière. Elle construit les éléments
       * html et les insère dans l'arborescence du document.
       *
       * contentId : seuls les titres contenus dans l'élément (et ses sous éléments)
       *             ayant comme id contentId seront utilisés pour la table des matières.
       *             ce doit être un identifiant valide et existant.
       * insertBeforeId : la table des matières sera insérée juste avant l'élément
       *                  portant cet identifiant. ce doit être un identifiant
       *                  valide et existant.
       * containerId : le nom du conteneur sera celui passé en paramètre. cet
       *               identifiant ne doit pas déjà être utilisé dans la page.
       * minHead : par exemple 5 pour titre h5 : les titres hiérarchiquement inférieurs
       *           sont ignorés. doit être compris entre 1 et 6.
       * maxHead : par exemple 2 pour titre h2 : les titres hiérarchiquement supérieurs
       *           sont ignorés. doit être compris entre 1 et 6 et doit être inférieur
       *           à minHead.
       * tableHeadLevel : un titre est inséré pour annoncer la table des matières.
       *                  utilisez 3 pour que le titre de cette table des matières soit
       *                  h3. doit être compris entre 1 et 6.
       * clickable : booléen indique si la table des matières est rétractable sur
       *             l'évènement click. doit prendre comme valeur true ou false.
       */
      function contentTable(contentId, insertBeforeId, containerId, minHead,
                            maxHead, tableHeadLevel, clickable) {
     
        var contentTableTitle = 'Table des matières';
        var anchorName = 'tableDesMatieres';
        var anchorsNumberingBeginning = 0;
        var openedClass = 'ouvert';
        var closedClass = 'ferme';
     
     
        if (!document.getElementById) return;
     
     
        if (!minHead || minHead < 1 || minHead > 6) {
          minHead = 6;
        }
     
        if (!maxHead || maxHead < 1 || maxHead > minHead) {
          maxHead = 1;
        }
     
        if (!tableHeadLevel || tableHeadLevel < 1 || tableHeadLevel > 6) {
          tableHeadLevel = 2;
        }
     
     
        if (document.getElementById(containerId)) {
     
          alert(containerId + ' already exists in this page!');
          return;
     
        }
        else if (!document.getElementById(insertBeforeId)) {
     
          alert(insertBeforeId + ' is not an existing id!');
          return;
     
        }
        else if (!document.getElementById(contentId)) {
     
          alert(contentId + ' is not an existing id!');
          return;
     
        }
        else {
     
          var TCContainer = document.createElement('div');
     
          TCContainer.id = containerId;
     
          var content = document.getElementById(contentId);
     
          var chapters = Array();
     
          headTag(content, chapters);
     
          if (chapters.length < 2) return;
     
          var TCTitle = document.createElement('h' + tableHeadLevel);
          TCTitle.appendChild(document.createTextNode(contentTableTitle));
     
          TCContainer.appendChild(TCTitle);
     
     
          var theList = document.createElement('ul');
     
     
          if (clickable) {
     
            TCTitle.onclick = function() { TCSwap(containerId, openedClass, closedClass) };
     
            TCTitle.className = openedClass;
     
            theList.onclick = function() { TCSwap(containerId, openedClass, closedClass) };
     
          }
     
          for (var i = 0; i < chapters.length; i++) {
     
            var titleNumber = parseInt(chapters[i].nodeName.charAt(1));
     
     
            if (titleNumber <= minHead && titleNumber >= maxHead) {
     
              var anItem = document.createElement('li');
     
              var aLink = document.createElement('a');
              aLink.appendChild(document.createTextNode(inText(chapters[i])));
     
              anItem.className = chapters[i].nodeName.toLowerCase();
     
     
              if (chapters[i].id) {
     
                aLink.href = '#' + chapters[i].id;
     
              }
              else {
     
                do {
     
                  anchorsNumberingBeginning++;
     
                } while (document.getElementById(anchorName + anchorsNumberingBeginning))
     
     
                chapters[i].id = anchorName + anchorsNumberingBeginning;
     
                aLink.href = '#' + chapters[i].id;
     
              }
     
              anItem.appendChild(aLink);
     
              theList.appendChild(anItem);
     
            }
     
          }
     
          TCContainer.appendChild(theList);
     
          var beforeElement = document.getElementById(insertBeforeId);
     
          var theParent = beforeElement.parentNode;
     
          theParent.insertBefore(TCContainer, beforeElement);
     
        }
     
      }
     
     
     
     
      /* Cette fonction ajoute récursivement la liste des balises d'en-têtes à l'intérieur 
       * d'un noeud dans le tableau passé en paramètres. Afin de conserver l'ordre et de 
       * prendre en compte tous les éléments d'un noeud, cette fonction est récursive.
       * node : Il s'agit du noeud dans lequel on recherche les éléments titre.
       * headArray : Il s'agit du tableau dans lequel on va ajouter les noeuds
       *             des éléments titre Hn.
       */
      function headTag(node, headArray) {
     
        var childrenNumber = node.childNodes.length;
     
        for (var i = 0; i < childrenNumber; i++) {
     
          var element = node.childNodes[i];
     
          var elementName = element.nodeName.toLowerCase();
     
          if (elementName == 'h1' || elementName == 'h2' || elementName == 'h3' 
                                  || elementName == 'h4' || elementName == 'h5' 
                                  || elementName == 'h6') {
     
            headArray[headArray.length] = element;
     
          }
          else {
     
            headTag(element, headArray);
     
          }
     
        }
     
      }
     
     
      /* Cette fonction retourne le texte contenu dans un noeud, uniquement le texte.
       * Le texte est épuré de toutes les balises intermédiaires.
       * node : le noeud pour lequel on ne souhaite récupérer que la partie textuelle.
       */
      function inText(node) {
     
        var childrenNumber = node.childNodes.length;
     
        var foundString = "";
     
        if (childrenNumber == 0) {
          return node.nodeValue;
        }
        else { 
     
          for (var i = 0; i < childrenNumber; i++) {
     
            foundString += inText(node.childNodes[i]);
     
          }
     
          return foundString;
     
        }
     
      }
     
    </script>
    Reste à remplacer la partie création de la table pour une page HTML avec la méthode this.bookmarkRoot.children[a].children[b].children[c].createChild(cName: titre) pour le pdf mais je débute en Javascript et j'ai besoin d'une aide

    Voici un squelette simplifié pour la construction de la table avec les niveaux de <h1> à <h3> pour un pdf :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    // contruction d'une table des matières (bookmark ou signets) d'un pdf avec JavaScript pour Acrobat pro
     
    var myRoot = this.bookmarkRoot;
     
    var text1, text2, text3;
    var index1 = index2 = index3 = 0;
     
    // la méthode getElementsByTagNames('h1,h2,h3') est peut-être utile pour la recherche des balises ?
     
    while ( [ le doc pdf contient <h1> ] )   // comment trouver la balise <h1> suivante dans le pdf ?
     
     {
      text1 = [ extraire le texte entre <h1> et </h1> ];  // comment extraire le texte entre les balises ?
      myRoot.children[index1].createChild(cName: text1);  // création du titre niveau 1
     
      while ( [ le doc pdf contient <h2> ] )  // comment trouver la balise <h2> suivante dans le pdf ?
       {
        titre2 = [ extraire le titre entre <h2> et </h2> ];  // comment extraire le texte entre les balises ?
        myRoot.children[index1].children[index2].createChild(cName: text2);   // création du titre niveau 2
     
        while ( [ le doc pdf contient <h3> ] )    // comment trouver la balise <h3> suivante dans le pdf ?
         {
          titre3 = [ extraire le titre entre <h3> et </h3> ]; // comment extraire le texte entre les balises ?
          myRoot.children[index1].children[index2].children[index3].createChild(cName: text3);   // création du titre niveau 3
          index3++;
         }
     
        index3 = 0; // fin du niveau 3 et index 3 prêt pour la série suivante
        index2++;   // niveau 2 suivant
     
       }
     
      index2 = 0; // fin du niveau 2 et index 2 prêt pour la série suivante
      index1++;   // niveau 1 suivant
     }

    Merci de votre aide !

    François
    www.souslesmers.fr

    Le fichier PDF pour l'exemple de titre <h1> à <h3> :
    Images attachées Images attachées

Discussions similaires

  1. Réponses: 2
    Dernier message: 24/10/2012, 13h38
  2. table des matiéres - fichier pdf
    Par nina2007 dans le forum Mise en forme
    Réponses: 2
    Dernier message: 11/05/2011, 14h42
  3. [PHP 5.2] PDF et table des matières
    Par Warsgof dans le forum Langage
    Réponses: 4
    Dernier message: 29/12/2010, 17h11
  4. [WD-2007] table des matières et export PDF
    Par XULASEMOULE dans le forum Word
    Réponses: 5
    Dernier message: 02/03/2010, 10h35
  5. Table des matières dans le viewer de pdf
    Par Gwindor dans le forum Mise en forme
    Réponses: 2
    Dernier message: 07/08/2009, 11h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo