IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

JavaScript Discussion :

Parser un fichier PDF


Sujet :

JavaScript

  1. #1
    Membre éclairé
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2014
    Messages
    521
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2014
    Messages : 521
    Par défaut Parser un fichier PDF
    Bonjour.

    J'aimerai pouvoir transformer un pdf en fichier json, contenant texte, liens images etc...
    J'ai essayé pdfjs mais il est super lourd et propose toute une interface view dont je n'ai pas besoin.

    Connaissez vous une librairie pour faire ça ?

    Merci d'avance,

    Maz

  2. #2
    bm
    bm est déconnecté
    Membre extrêmement actif

    Homme Profil pro
    Freelance
    Inscrit en
    Octobre 2002
    Messages
    874
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations professionnelles :
    Activité : Freelance
    Secteur : Tourisme - Loisirs

    Informations forums :
    Inscription : Octobre 2002
    Messages : 874
    Billets dans le blog
    6
    Par défaut
    Bonjour,

    Le PDF est un format de fichier binaire structuré avec un objectif spécifique en tête.
    JSON est une sérialisation générale de tout type de données textuelles.

    À quoi vous attendriez-vous en passant de l'un à l'autre (en particulier sans perte)?

    Selon les informations que vous recherchez.

    Pour la conversion du texte, prenez simplement quelques outils d'extraction de texte comme PyPDF2

    Voir : forum python

Discussions similaires

  1. Parser un fichier Pdf
    Par Sotoaleono dans le forum C++
    Réponses: 6
    Dernier message: 06/01/2017, 12h30
  2. Réponses: 11
    Dernier message: 19/08/2015, 14h20
  3. parser un fichier html
    Par noarno dans le forum ASP
    Réponses: 2
    Dernier message: 10/12/2003, 17h53
  4. Streaming fichier PDF
    Par rgarnier dans le forum XMLRAD
    Réponses: 4
    Dernier message: 22/05/2003, 22h14
  5. [XMLRAD] Fichier PDF
    Par Sylvain Leray dans le forum XMLRAD
    Réponses: 2
    Dernier message: 09/01/2003, 10h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo