IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Documents Java Discussion :

Conversion de fichiers Word .docx en HTML


Sujet :

Documents Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Inscrit en
    Novembre 2002
    Messages
    15
    Détails du profil
    Informations forums :
    Inscription : Novembre 2002
    Messages : 15
    Par défaut Conversion de fichiers Word .docx en HTML
    Bonjour à tou(te)s,

    je suis sur un nouveau projet, où je dois récupérer toutes les informations de fichiers .docx, à priori en Java.

    J'ai bien trouvé les bibliothèques POI & DocX4J, qui permettent de lire les documents, mais cela ne suffit pas : j'ai toujours des graphiques associés (généralement des images, pas insurmontable, mais aussi des graphiques Excel : là, je sèche), souvent des en tête & pieds de page, des notes de bas de page, etc.

    Je sais trouver les fichiers XML de chaque sorte, mais je me sens glisser vers un nouveau parsage de XML, ce qui ne devrait pas arriver.
    Je veux bien croire que j'ai cherché comme un manche, mais je n'ai pas trouvé de procédure pour récupérer les objets extérieurs et les replacer dans un HTML ; en attendant, j'ai trouvé pas mal de cas d'utilisation... dans le sens inverse (créer un docx)

    Si une bonne âme a un pointeur sur quelque chose pour moi, je le remercierai d'autant plus que sinon je sens que je devrai abandonner cette voie.

    Salut à tous ceux qui m'ont lu!

  2. #2
    Expert éminent
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Par défaut
    Regarde du coté de JODConverter , qui permet de piloter openoffice et faire des conversions de document office.

  3. #3
    Membre averti
    Inscrit en
    Novembre 2002
    Messages
    15
    Détails du profil
    Informations forums :
    Inscription : Novembre 2002
    Messages : 15
    Par défaut
    Merci pour le pointeur, mais après analyse, je ne peux pas le retenir : la conversion en HTML programmatique ne sort qu'un HTML (pas les images et autres inserts) et le projet est signalé comme plus maintenu ; mon besoin n'est pas ponctuel, il s'agit d'automatiser des conversions pour un flux continu de publications.
    Je cherche encore, et écoute encore ce fil, sinon je devrai développer à plus bas niveau qu'espéré.

  4. #4
    Membre Expert
    Avatar de azerr
    Homme Profil pro
    Ingénieur Etude JEE/Eclipse RCP
    Inscrit en
    Avril 2006
    Messages
    942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Drôme (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur Etude JEE/Eclipse RCP
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Avril 2006
    Messages : 942
    Par défaut
    Bonjour,

    XDocReport te fournit un converter docx->xhtml basé sur Apache POI.

    Si tu as des questions sur ce converter, n'hesites pas, voir même poster sur le forum de XDocReport.

    Angelo

Discussions similaires

  1. Réponses: 0
    Dernier message: 10/04/2013, 15h29
  2. [WD-2003] Convertir fichier word en pages HTML
    Par magnetolivier dans le forum Word
    Réponses: 1
    Dernier message: 19/11/2012, 20h22
  3. Lire un fichier Word docx
    Par ifsera dans le forum Documents
    Réponses: 1
    Dernier message: 12/07/2012, 14h14
  4. Réponses: 7
    Dernier message: 06/10/2009, 14h49
  5. fichier word et wordperfect en HTML
    Par Nadine dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 28/02/2005, 22h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo