IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques et frameworks PHP Discussion :

[PDF] Extraire texte d'un PDF


Sujet :

Bibliothèques et frameworks PHP

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 6
    Points : 6
    Points
    6
    Par défaut [PDF] Extraire texte d'un PDF
    Bonjour,

    Je souhaiterai savoir si, en PHP, on peut uploader un fichier PDF et extraire son contenu pour l'enregistrer dans une base de données mysql ?

  2. #2
    Débutant
    Homme Profil pro
    Développeur Web
    Inscrit en
    Octobre 2006
    Messages
    1 125
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 1 125
    Points : 704
    Points
    704
    Évènements dans le 06?
    www.sortir06.com

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    146
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 146
    Points : 52
    Points
    52
    Par défaut
    Bonjour,

    je fais suite à la requete de ludwig59 car je suis dans la même situation que lui.
    J'ai regardé les liens proposés en réponse mais je ne parviens pas vraiment à trouver ce qu'il me faut ou plutôt, je ne sais pas trop m'en servir.

    J'ai bien regardé la liste de toutes les expressions régulières PHP comportant le mot PDF dedans ( http://nl2.php.net/manual/fr/book.pdf.php ) mais je ne vois pas grand chose qui puisse m'aider.
    Une expression m'a tout de même attirée : PDF_info_matchbox , mais j'avoue que j'ai bien du mal à comprendre comment je dois m'en servir. En effet, aucun exemple n'est donné, ce qui ne facilite pas son application.

    Pouvez-vous m'aider?

    Merci beaucoup

  4. #4
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    80
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 80
    Points : 59
    Points
    59
    Par défaut
    Si tu as un serveur dédié, essayes pdftotext ( composant inclu avec Xpdf )

  5. #5
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    Mars 2002
    Messages
    39 634
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 74
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2002
    Messages : 39 634
    Points : 66 650
    Points
    66 650
    Billets dans le blog
    1
    Par défaut
    Désolé de déterré un post comme ça, mais je recontre le même besoin et les quelques tests que j'ai pu effectuer avec XPDFne me donnent pas satisfaction dasn le sens ou les document générés pas PDFCréator ou PrimoPdf ne retournent aucun texte
    Ma page Developpez - Mon Blog Developpez
    Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts)
    Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir...
    Votre post est résolu ? Alors n'oubliez pas le Tag

    Venez sur le Chat de Développez !

  6. #6
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 6
    Points : 6
    Points
    6
    Par défaut
    Bonjour,
    Concernant la récupération du contenu d'un PDF, il y a peut être une solution avec PHP5 :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    $p = PDF_new();
    $pdfinput = "TET-datasheet.pdf";
    $docoptlist = "requiredmode=minimum";
    /* Open the input document */
    $doc = PDF_open_pdi_document($p, $pdfinput, $docoptlist);
     
    $contents = PDF_pcos_get_stream($p, $doc, "", "/Root/Metadata");
    print(strlen($contents) . " bytes \n");
     
    PDF_close_pdi_document($p, $doc);
    PDF_delete($p);
    Voir exemple complet :


    Par contre je ne l'ai pas testé.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Extraire texte d'un fichier pdf
    Par nicoaix dans le forum Langage
    Réponses: 7
    Dernier message: 03/02/2017, 17h30
  2. Extraire texte d'un PDF
    Par Philigane dans le forum Langage
    Réponses: 0
    Dernier message: 04/10/2014, 19h57
  3. extraire texte word
    Par cterra dans le forum Documents
    Réponses: 13
    Dernier message: 29/11/2006, 15h36
  4. extraire texte powerpoint
    Par cterra dans le forum Documents
    Réponses: 1
    Dernier message: 03/10/2006, 16h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo