IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VBA Discussion :

PDF - Extraction de la table des matières et du nombre de pages


Sujet :

VBA

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Juillet 2005
    Messages
    115
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2005
    Messages : 115
    Points : 47
    Points
    47
    Par défaut PDF - Extraction de la table des matières et du nombre de pages
    Hello,

    Je suis en train de faire un fichier excel permettant de lister tous les documents d'un répertoire et de ses sous répertoires. Ces documents sont en grande majorité des .pdf. Je souhaite également avoir le nombre de pages de chaque document et finalement pouvoir extraire la table des matières de chaque document.

    La partie permettant de lister les fichiers fonctionne, ainsi que la récupération du nombre de pages. Toutefois pour le nombre de page je m'amuse à ouvrir le fichier en un array de bytes et à parser chaque pdf en comptant le nombre de fois que je retrouve les tags /Type/Page.

    N'y a-t-il pas un moyen plus simple pour le faire, je viens de voir qu'il y a une API Adobe permettant d'instancier ce genre d'objets:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
        Dim PDFApp As AcroApp
        Dim PDFDoc As AcroAVDoc
    N'y a-t-il pas une fonction le faisant directement? J'ai beau chercher je n'ai pas trouvé de réponses pertinentes.

    Par contre en ce qui concerne l'extraction de la table des matières, je n'ai pas vraiment d'idée....

    Pourriez-vous m'aider?

    Merci d'avance.

    A+

  2. #2
    Expert éminent sénior
    Avatar de kiki29
    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    Juin 2006
    Messages
    6 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : Juin 2006
    Messages : 6 132
    Points : 11 274
    Points
    11 274
    Par défaut
    Salut, pour le texte voir par exemple ici
    Pour le nombre de pages :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    Option Explicit
     
    Sub Tst()
    Dim iPage As Long
    Dim PDDoc As Object
    Dim sNomFichier As String
     
        sNomFichier = "C:\Transfert\Test.pdf"
     
        Set PDDoc = CreateObject("AcroExch.PDDoc")
        PDDoc.Open sNomFichier 
            iPage = PDDoc.GetNumPages()
        PDDoc.Close
        Set PDDoc = Nothing
     
        MsgBox iPage
     
    End Sub

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Juillet 2005
    Messages
    115
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juillet 2005
    Messages : 115
    Points : 47
    Points
    47
    Par défaut
    Merci pour ta réponse.

    J'ai en effet trouvé un moyen de récupérer le contenu du fichier .pdf dans mon fichier excel comme dans l'exemple que tu m'as fourni.
    Par contre je le récupère de manière brute et je cherche à savoir si dans le document pdf il n'y a pas de balises indiquant le début et la fin de la table des matières que je pourrais reconnaitre?

    A+

Discussions similaires

  1. Table des matières - insertion sans renvoi à une page
    Par kitts dans le forum Mise en forme
    Réponses: 1
    Dernier message: 10/05/2011, 23h51
  2. [PHP 5.2] PDF et table des matières
    Par Warsgof dans le forum Langage
    Réponses: 4
    Dernier message: 29/12/2010, 17h11
  3. pdf tables des matières
    Par cranx dans le forum Général JavaScript
    Réponses: 2
    Dernier message: 26/11/2010, 12h42
  4. [WD-2007] table des matières et export PDF
    Par XULASEMOULE dans le forum Word
    Réponses: 5
    Dernier message: 02/03/2010, 10h35
  5. Table des matières dans le viewer de pdf
    Par Gwindor dans le forum Mise en forme
    Réponses: 2
    Dernier message: 07/08/2009, 11h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo