-
du .doc au Pdf
Bonjour,
je m'intéresse ces jours là à la conversion du doc au pdf, j'ai commencé par bien me documenter sur l'affaire!
j'aimerais avoir votre avis: quels API? j'ai entendu parler de iText, FOP, Apache POI...
à vous les expert ;)
des pistes? des idées?
-
aucune des trois, elle font toute te permettre de générer des pdf, pas de faire le rendu d'un .doc. Le seul moyen plus ou moins fiable que je connaisse de faire de la conversion doc -> pdf c'est par l'utilisation de openoffice , via par exemple, l'intermédiaire de la librairie jodconverter en java.
environnement graphique et serveur openoffice requis.
-
Si tu as moyen de transformer tes .doc au format WordML (de Word 2003), MS a publié des XSL-T vers le format XSL-FO qui peut lui être rendu en PDF via un moteur (Fop, RenderX, ...).
Mais pas garantie que le rendu soit exactement pareil que sous Word. Surtout au niveau des marges & entêtes si je me souviens bien. Mais il y a un peu moins de pré-requis logiciel qu'en passant par OO.
-
j'avais essayé à une époque, vu l'avancement de FOP à ce moment là, et le nombre de fonctions pas supportée, c'était assez catastrophique comme résultat. De plus était FOP est relativement lent pour faire son rendu (on a été ici jusqu'à une lenteur de 10 secondes / page, sur un document de 50 pages tu le sent vraiment passer)
-
Je me sert de cette approche pour une appli web où les modèles de document sont rédigés via word puis il y a une fusion avec des données xml.
C'est fop 0.20 (il y aurait des adaptations aux xsl-t à faire pour les versions plus récentes) qui fait l'affichage en PDF.
Les documents sont simples, n'ont pas d'image (c'est des décisions administratives), il y a parfois des tableaux et font en général 3 pages (~1sec de rendering).
J'ai ponctuellement des doc de 50 pages les perfs restent acceptable dans un context web (<10 sec).
J'ai légèrement retouché les XSL-T.
-
Merci pour vos réponses!
en effet, je sais que la création de fichiers pdf est possible avec l'API FOP
(à partir d'un fichier XSL-FO )
j'ai eu l'idée d'utiliser une api pour faire le parsing des fichiers DOC (à priori l'api Apache POI le permet) pour créer le fichier XSL-FO correspondant.
la sortie du POI sera l'entrée de FOP!! :koi:
je vais essayer de suivre cette approche et je reviendrais vers vous pour vous raconter l'histoire :mouarf:
A+
-
-
Merci pour le lien, ça m'a énormément servi :mrgreen:
ça confirme mes doutes : Pas de conversion implicite DOC ---> XSL-FO
il faut lire le fichier doc mot à mot et écrire manuelllement l' xsl fo correspondant :aie:
c'est plutôt galère, mais c'est un bon challenge :king: