IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

Comment récupérer la mise en forme d'un texte dans un PDF pour afficher le texte en html ? [Python 3.X]


Sujet :

Réseau/Web Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2022
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2022
    Messages : 20
    Par défaut Comment récupérer la mise en forme d'un texte dans un PDF pour afficher le texte en html ?
    Bonjour
    Je viens d'arriver, et de faire ma présentation. Je construis mon blog, en utilisant Bottle, car je suis très peu capé. J'ai des textes rédigés avec Pages sous macOS, avec éventuellement des images, convertis en PDF, et je voudrais savoir s'il est possible de les afficher sur une page html. J'ai vu qu'il existe des modules, PyPDF par exemple, qui permettent d'extraire les "métadonnées" (j'ai retenu le mot, mais je vois pas forcément hyper bien ce que c'est). Ça me permettrait de pouvoir charger le texte directement sans avoir à mettre manuellement les polices, les italiques, etc.

    La solution qui consiste à demander à l'utilisateur de cliquer pour télécharger le fichier ne me plaît pas, je préfère que tout soit déjà là quand la page html s'affiche.

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 770
    Par défaut
    Salut,

    inclure du PDF (en le convertissant) dans une page HTML n'est pas vraiement un sujet Python (en tout cas on peut faire sans).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre Expert
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Février 2003
    Messages
    1 605
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2003
    Messages : 1 605
    Par défaut
    Bonjour.

    PyPDF4 permet pas mal de manipulations avec du PDF, dont extraire du texte.

    https://pypi.org/project/PyPDF4/

  4. #4
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2022
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2022
    Messages : 20
    Par défaut
    wiztricks et arioch, merci pour votre réponse.
    wiztricks, "on peut faire sans" : c'est-à-dire ? Si j'utilise Python, il me semble logique d'essayer de le faire en Python !
    arioch, merci pour la doc python. Bien sûr, il faut commencer par là !

  5. #5
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 770
    Par défaut
    Citation Envoyé par meslier Voir le message
    wiztricks, "on peut faire sans" : c'est-à-dire ? Si j'utilise Python, il me semble logique d'essayer de le faire en Python !
    Transformer un PDF en HTML en récupérant le formatage et les polices de caractères est un programme qui prend un ficher en entrée et en produit un autre en sortie.
    Il n'y a aucun intérêt à ré-écrire cela soit même s'il existe des solutions prêtes à l'emploi (écrites avec Python pourquoi pas) qu'on peut trouver sur Internet en cherchant un peu (et si elle n'est pas codée avec Python, çà marchera aussi).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  6. #6
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2022
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2022
    Messages : 20
    Par défaut
    OK, wiztricks ! Mais je ne vois pas comment trouver cette solution sur internet, si elle existe. Je suis content d'apprendre que ça a l'air d'être simple et d'exister déjà, mais pour l'instant, j'ai pas vu. Par ailleurs, comme mon application web va être écrite en python, je suis enclin naturellement à me tourner vers python. Je me revendique comme "étudiant", cela veut dire, outre que je ne possède que quelques bases, que ma culture informatique elle aussi est faible, et donc que "chercher sur internet" n'est pas forcément simple pour moi. J'ai un peu tendance, par exemple, à me tourner vers les forums pour trouver réponse à mes questions.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 22/10/2014, 17h32
  2. Réponses: 13
    Dernier message: 28/11/2011, 13h55
  3. Réponses: 5
    Dernier message: 17/06/2008, 15h17
  4. Comment garder la mise en forme d'un textarea ?
    Par dns78 dans le forum Langage
    Réponses: 4
    Dernier message: 09/06/2007, 14h53
  5. comment fixer la mise en forme
    Par tenderstoune dans le forum Balisage (X)HTML et validation W3C
    Réponses: 17
    Dernier message: 04/05/2007, 09h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo