IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XML/XSL et SOAP Discussion :

[XML]Transformations diverses (Word, PDF, ...) vers XML


Sujet :

XML/XSL et SOAP

  1. #1
    Candidat au Club
    Inscrit en
    Décembre 2006
    Messages
    2
    Détails du profil
    Informations forums :
    Inscription : Décembre 2006
    Messages : 2
    Points : 2
    Points
    2
    Par défaut [XML]Transformations diverses (Word, PDF, ...) vers XML
    bjr! voici ma question: il m'est demandé de construire une base documentaire dans laquelle je capitalise le fond documentaire de mon institut, les documents de la base doivent etre au format xml, je voudrais savoir comment convertire des documents des formats word, pdf et autre au format xml et comment stocker ces documents xml dans une BDD.merci

  2. #2
    Membre éprouvé Avatar de alain.couthures
    Profil pro
    Gérant
    Inscrit en
    Avril 2007
    Messages
    902
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Gérant

    Informations forums :
    Inscription : Avril 2007
    Messages : 902
    Points : 1 247
    Points
    1 247
    Par défaut
    Voilà une bonne idée pour la conservation des documents !
    Quel est le format XML retenu ?? Je préconiserais DocBook, ou TEI, car la mise en forme y est complètement disparue et qu'il est donc possible d'y appliquer, après, la charte graphique souhaitée.

    Pour Word, générer un WordML ou un OpenXML ne posera pas de problème (j'ai déjà écrit un programme C# pour ouvrir un fichier Word et l'enregistrer dans un autre format...). Après, une conversion en un autre format XML va dépendre de la qualité de ceux qui ont créé le document. Il faudrait, déjà, que les titres soient selon les styles correspondants...

    Par contre pour PDF, c'est une autre paire de manches ! Si tout le document est le résultat d'un scan, les pages ne sont que des images !!! Un traitement OCR peut récupérer des choses mais la qualité ne sera pas totale... Même si le PDF a été créé directement à partir d'un traitement de texte, c'est très probablement trop tard pour reconstituer automatiquement le texte source : tout est fait pour l'optimisation de l'impression; il n'y a plus de mots mais des glyphes (même pas des caractères!!) positionnées sur la feuille. C'est facile à vérifier quand on demande à Acrobat Reader de trouver une chaîne de caractères : il n'arrive pas à bien la mettre en inversion video... PDF = joli à l'écran, le bazar dedans
    Formulaires XForms sur tous navigateurs sans extension à installer (architecture XRX) : http://www.agencexml.com/xsltforms/

Discussions similaires

  1. [XSLT] transformation xml vers xml
    Par nemya dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 22/02/2006, 11h02
  2. Transformation XML vers XML
    Par runabout dans le forum XML/XSL et SOAP
    Réponses: 1
    Dernier message: 08/02/2006, 16h48
  3. transformation de xml vers xml
    Par moh_yougo dans le forum XML/XSL et SOAP
    Réponses: 3
    Dernier message: 05/02/2006, 14h51
  4. Transformation HTML vers XML
    Par pocahontaos dans le forum XML/XSL et SOAP
    Réponses: 5
    Dernier message: 23/01/2006, 23h14
  5. [WORD-->XML]Transformation .doc en .xml
    Par Hoegaarden dans le forum XML/XSL et SOAP
    Réponses: 14
    Dernier message: 30/08/2005, 12h05

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo