IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Interfaçage autre langage Python Discussion :

Récupérer les attributs d'un paragraphe de MS WORD, LibreOffice, OpenOffice


Sujet :

Interfaçage autre langage Python

  1. #1
    Membre actif
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Octobre 2008
    Messages
    330
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2008
    Messages : 330
    Points : 207
    Points
    207
    Par défaut Récupérer les attributs d'un paragraphe de MS WORD, LibreOffice, OpenOffice
    Bonjour à tous,

    Je cherche à lire un document (MS WORD ou autre en open source) afin de récupérer les différents contenus, paragraphes avec la mise en forme et les réinjecter dans ReportLab. Mes premières recherches m'ont orienté vers python-docx mais apparemment, la récupération des attributs (font, taille, couleur en particulier) sont difficiles à récupérer à cause d'une gestion d'héritage de style complexe ...
    Quelqu'un aurait-il une expérience sur le sujet ou des pistes.
    Merci pour vos aides.

  2. #2
    Membre actif
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Octobre 2008
    Messages
    330
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2008
    Messages : 330
    Points : 207
    Points
    207
    Par défaut
    Mes recherches m'ont emmené bien (trop) loin dont je vous ferai grâce mais je crois que la bonne piste est la transformation que je qualifierai presque de "magique" d'un fichier MS WORD en XML. J'ai trouvé çà sur le net. On remplace l'extension .docx en .zip et on extrait ce "nouveau" fichier et l'affaire est jouée ! On retrouve dans l'arborescence des fichiers un fichier :
    document.xml
    qui me semble contenir tout ce que je cherche. Reste à trouver un moyen de lire tout çà facilement, je suis nul en XML.
    Je continue à farfouiller ...

  3. #3
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Citation Envoyé par Triton972 Voir le message
    Je continue à farfouiller ...
    Wikipedia explique ce qu'est un document docx, le format Open Office XML et donne un tas de lien vers les documentations plus techniques.

    Ceci dit, exporter un document au format PDF est déjà quelque chose que sait faire LibreOffice.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. [DOM] Récupérer les attributs d'un fichier XML en PHP
    Par ePsymon dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 08/02/2008, 11h51
  2. [DOM] Récupérer les attributs d'une classe CSS ?
    Par titoumimi dans le forum Général JavaScript
    Réponses: 13
    Dernier message: 10/07/2007, 14h33
  3. [Débutant]Récupérer les attributs/paramètre d'un dossier
    Par Bloodscalp dans le forum Entrée/Sortie
    Réponses: 4
    Dernier message: 13/10/2006, 15h06
  4. [DOM Javascript]Récupérer les attributs
    Par gabychon dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 02/05/2006, 15h21
  5. [VB.Net] Comment récupérer les Attributs LDAP ?
    Par le Daoud dans le forum VB.NET
    Réponses: 6
    Dernier message: 03/03/2006, 11h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo