Bonjour,

Mon problème est très particulier, utilise plusieurs technologies et j'ai plusieurs solutions pour le résoudre mais aucune qui me convient.

En gros : Comment convertir des fichiers de types : odt, ppt, doc, docx, pptx, html, txt, wps... (bref tous les fichiers de texte courant) vers du PDF SANS utiliser un logiciel hôte (word, excel, open office...) et faire une impression sur une imprimante virtuelle.

Je vous explique.

Nous avons développé un système d'analyse et d'extractions d'informations contenues dans des CV de différents candidats. Ces fichiers sont envoyés dans différents formats : Word, PDF, html, odt, etc...
Le but était de visualiser en cliquant sur le nom du candidat, une prévisualisation dans une iframe de ce CV. C'est possible pour du PDF et du html mais pas pour ODT ou Word.

D'après mes recherches il y a deux solutions :
- Convertir tous mes fichiers en PDF mais les convertisseurs multi format que je trouve qui fonctionne en mode BATCH utilisent le logiciel hôte pour simuler une impression.
Seulement, le flux est trop important et je ne peux pas me permettre de lancer 30 instances de word , ooo et works simultanément pour convertir 30 fichiers doc, odt, wps. Il me faut donc un truc léger
(je ne peux pas aussi mettre en file d'attente et les traiter un par uns).
(Pour informations, l'extraction des données des CV se fait par un fournisseur qui nous renvoi le contenu au format XML que nous interprétons derrière)

Il existe aussi la possibilité d'envoyer à des services web dédiés (google docs par exemple) mais pour des raisons de confidentialités, nous ne voulons pas que les CV sortent de notre système informatique pour aller à des tiers qui peuvent réutiliser les informations des CV.

Avez vous des idées pour ce que je cherche à faire ?

Merci,

Antoine