+ Répondre à la discussion
Affichage des résultats 1 à 3 sur 3
  1. #1
    Futur Membre du Club
    Inscrit en
    juillet 2005
    Messages
    115
    Détails du profil
    Informations forums :
    Inscription : juillet 2005
    Messages : 115
    Points : 17
    Points
    17

    Par défaut PDF - Extraction de la table des matières et du nombre de pages

    Hello,

    Je suis en train de faire un fichier excel permettant de lister tous les documents d'un répertoire et de ses sous répertoires. Ces documents sont en grande majorité des .pdf. Je souhaite également avoir le nombre de pages de chaque document et finalement pouvoir extraire la table des matières de chaque document.

    La partie permettant de lister les fichiers fonctionne, ainsi que la récupération du nombre de pages. Toutefois pour le nombre de page je m'amuse à ouvrir le fichier en un array de bytes et à parser chaque pdf en comptant le nombre de fois que je retrouve les tags /Type/Page.

    N'y a-t-il pas un moyen plus simple pour le faire, je viens de voir qu'il y a une API Adobe permettant d'instancier ce genre d'objets:

    Code :
    1
    2
        Dim PDFApp As AcroApp
        Dim PDFDoc As AcroAVDoc
    N'y a-t-il pas une fonction le faisant directement? J'ai beau chercher je n'ai pas trouvé de réponses pertinentes.

    Par contre en ce qui concerne l'extraction de la table des matières, je n'ai pas vraiment d'idée....

    Pourriez-vous m'aider?

    Merci d'avance.

    A+

  2. #2
    Expert Confirmé Sénior

    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    juin 2006
    Messages
    2 773
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : juin 2006
    Messages : 2 773
    Points : 7 052
    Points
    7 052

    Par défaut

    Salut, pour le texte voir par exemple ici
    Pour le nombre de pages :
    Code :
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    Option Explicit
     
    Sub Tst()
    Dim iPage As Long
    Dim PDDoc As Object
    Dim sNomFichier As String
     
        sNomFichier = "C:\Transfert\Test.pdf"
     
        Set PDDoc = CreateObject("AcroExch.PDDoc")
        PDDoc.Open sNomFichier 
            iPage = PDDoc.GetNumPages()
        PDDoc.Close
        Set PDDoc = Nothing
     
        MsgBox iPage
     
    End Sub
    Pensez à Voter, d'avance merci.
    Balisez votre code après l'avoir indenté sous Excel via Smart Indenter
    Autres utilitaires : MZ Tools 3.0 VBA 7Zip et Compacter projets VBA

    Contributions : Excel / Word / PDF avec Adobe Acrobat Pro / PDFCreator et Téléchargements

  3. #3
    Futur Membre du Club
    Inscrit en
    juillet 2005
    Messages
    115
    Détails du profil
    Informations forums :
    Inscription : juillet 2005
    Messages : 115
    Points : 17
    Points
    17

    Par défaut

    Merci pour ta réponse.

    J'ai en effet trouvé un moyen de récupérer le contenu du fichier .pdf dans mon fichier excel comme dans l'exemple que tu m'as fourni.
    Par contre je le récupère de manière brute et je cherche à savoir si dans le document pdf il n'y a pas de balises indiquant le début et la fin de la table des matières que je pourrais reconnaitre?

    A+

Liens sociaux

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •