Bonjour,
je veux convertir des fichiers .doc et .pdf au format XML
merci d'une réponse simple pour simple executant bureautique.
Bonjour,
je veux convertir des fichiers .doc et .pdf au format XML
merci d'une réponse simple pour simple executant bureautique.
si tu utilise openoffice tu peux génerer unnodt qui est en faite un fichier xml.
Je sais qu'au niveau office tu peux enregistrer au format xml
merci de la réponse
j'ai téléchargé Oo, ensuite veux-tu bien m'expliquer pas à pas :
prble : 'ai complété un très long doc sur un site et j'ai fait la sottise de sauvgder sous .pdf, donc je ne peux plus le charger au foramt XML pour continuer, et je cherche une altrnative à tout recommencer.
A partir de OO tu fais export et tu choisit xhtml et voila tu as un fichier xml valide
bonjour,
c'est ce que j'avais fait, mais ça ne marche pas pour le charger ensuite depuis le site web.
Bonsoir Barnebe,
Je ne comprends pas bien la question personellement. Pourrais-tu eclaircir ?
Tu as téléchargé un fichier *.doc depuis le web, mais tu l'as enregistré par erreur au format PDF. C'est bien ça ?
Ensuite, tu converti le fichier PDF au format XML avec OOo. Mais là où je ne comprend pas, c'est quand tu dis qu'ensuite tu ne peux pas le charger depuis le site web : ça n'est pas logique, puisque tu ne télécharge pas le fichier XML.... c'est le fichier d'origine que tu as téléchargé.
Ou alors peut-être veux-tu dire que tu veux envoyer le fichier sur un site, pour qu'on puisse le consulter sur le site ?
Je ne suis pas sûr d'avoir compris, mais donc en fait je crois que tu veux envoyer sur un site, et que tu as envoyer un fichier PDF au lieu d'un fichier XML, et que le fichier d'origine est donc de toi.
Si tu as put envoyer le fichier PDF sur ton site, normalement tu peux envoyer le fichier XML sans plus de problèmes également... surtout si c'est un fichier XHTML.
Enfin.... si je n'ai pas bien compris, dis moi.
@Fraoustin:
Merci pour l'info sur OOo. Je n'avais pas qu'il convertissait le PDF. Mais il extrait également les images ? Et le résultat produit est vraiment correcte ? Perso, je deteste le PDF, on ne peut rien en faire... c'est vraiment une poisse ce format. Et les extrateurs de texte que j'ai put essayer étaient tous assez pitoyables (en plus ils n'extraient généralement pas les langues étrangère ayant un alphabet non-latin). Ca fait une raison de plus pour plébiciter XML
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
bonjour Hibou,
merci de la réponse, mon prble est le svt :
sur le site, j'ai complété un formulaire , que le site propose d'enregistrer en .pdf+xml , en .pdf et en .doc.
Mon texte est "à suivre", je continue à l'écrire périodiquement en rechargeant sur le site mon fichier enregistré, ce qui me permet de retrouver la suite du formulaire vierge à compléter.
Au dernier enregistrement, j'ai zappé le format xml. Sur le site je ne peux plus charger mon fichier .doc et .pdf, il n'est pas pris.
je peux bidouiller des lignes vierges sur le .doc avec des copier-coller mais ça perd du temps et finit par me prendre le chou.
La conversion avec Oo semblait la bonne idée, mais ça n'a pas marché.
merci cpd pour cette info.
Salut,
Mmmhh.... oui, je crois que je comprend un peu mieux (même s'il y a quelques détails qui m'échappent encore je crois).
Excuse moi, j'ai une question bête : est-ce que le document que tu veux transformer est long ? Est-ce qu'il est complexe ? ... Tu sais, tu peux peut faire du XML à la main avec un simple éditeur comme NotePad si vraiment c'est nécéssaire. Si ce fichier est vraiment important, alors ça vaut peut-être la peine de prendre ce temps.
Donc tu as déjà plusieurs fichiers XML du même site, que tu as enregistré avant. Est-ce que tu pourrais ouvrir un de ces fichiers XML avec NotePad (tu verra que c'est tout à fait lisible pour un être humain... ce n'est que du texte ), ensuite est-ce que tu pourrais chercher dans les premières lignes, et voir si tu y trouve une ligne qui commence par <!DOCTYPE ...... Tu pourrais nous donner cette ligne ici si tu la trouve ?
Ton fichier PDF à convertir : il fait combien de lignes environ ? Ou alors combien de caractères ?
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
RE
merci de la réponse.
c'est un seul fichier XML périodiquement actualisé, 4500 car. Enfin, c'était un fichier XML, avant que je perde ce format au dernier enregistrement.
Salut,
4.5Ko de données : il est réaliste d'espérer pouvoir recomposer le XML à la main. Mais as-tu une indication <!DOCTYPE .... ? As-tu gardé copie d'un de ces fichiers XML pour aller voir à l'intérieur ?
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
Salut Hibou chevronné,
non, je n'ai pas de copie du fichier XML, sinon, je ne serais pas venue sur ce chic forum demander un help.
je n'ai plus qu'une version.doc et une .pdf
Bonsoir Tao Bernebe
Hooo... chevroné n'est que petite gens ici... tu es trop aimable
Sinon : est-ce que tu peux créer un autre fichier ? ... juste un fichier factice pour avoir son doctype ? Ou alors demander l'entête du fichier XML à quelqu'un qui utiliserait ce système aussi.
D'aprés ce que j'ai compris, tu ne peux même plus éditer, parce que pour mettre à jour, il faut que tu ai le XML que tu veux mettre à jours.... mais peut-être que tu peux créer un autre fichier initial par exemple, ce qui te permettrait d'avoir un fichier XML.
Autre idée : as-tu demandé au/à-la webmaster de ce site, s'il n'y a pas un système qui stoque temporairement les fichiers édités ? Parce que si tu as un log sur ce site, alors peut-être existe t-il une copie de sauvegarde temporaire associée à ton log.... essais de te renseigner auprés du/de-la webmaster
Parce que de toute façon, pour convertir au format XML adéquat, il nous faut connaître le format précis que doit avoir ce fichier XML (et aucune application de conversion de PDF vers XML ne pourrait de toute façon deviner le format ou le « doctype » que doit avoir ce fichier XML.... il nous faut donc le connaître pas nous-même)
C'est trés-trés important ce fichier ? C'est à titre professionel ou personnel ?
(ne répond pas si cette dernière question te semble trop indiscrète)
A plus....
P.S. Je n'ai pas encore été voir pour le lien que tu m'a donné... j'irai le voir aprés-demain.
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
juste pour donnée mon avis sur le format pdf:
comme format d'échange il faut oublier il n'est pas fait pour cela
comme fprmat pour avoir une bonne impression et éviter de le modifier facilement là il est très bien.
Pour moi le pdf est un pcl pour tous
"D'aprés ce que j'ai compris, tu ne peux même plus éditer, parce que pour mettre à jour, il faut que tu ai le XML que tu veux mettre à jour"
bravo Inspecteur Hibou, c'est l'enigme à résoudre...
j'ai suivi tes conseils de rcherche :
- le serveur s'engage à ne rien garder
- le/la webmaster est introuvable
Bonsoir,
Alors ne reste plus que la solution de créer un autre fichier XML, juste pour voir son doctype.... en priant pour que le doctype soit publique : ce qui n'est même pas certain aprés tout.... mais ne desespéront pas avant d'avoir de bonnes raisons de desespérer (je blague)
Peux-tu créer ce fichier XML factice ? Ou es-tu absolument obligé d'avoir un fichier en entrée ? Tu peux créer un nouveau fichier initial ?
Au fait encore : tu as regardé dans tes dossier pour voir si tu n'as pas une copie de sauvegarde d'un des anciens XML (un fichier qui correspondrait à un ancienne version du document, et que tu aurais enregistré quelque part par exemple).
Allez, à bientôt
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
bonsoir
c'est très sympa, les encouragements...
j'ai retrouvé un template en .sxw, est ce que ça peut aider ?
(je ne sais rien faire )
Beh.... c'est-à-voir. les templates *.sxw sont apparement des templates OpenDocument, et OpenDocument c'est en XML, alors c'est peut-être une bonne piste. Reste à savoir comment fonctionne le template, pour savoir s'il a le même doctype que le document dont il doit diriger la production.
Quelqu'un(e) connais le format des templates *.sxw ici ?
Est-ce que tu peux le compresser (zipper) et le transmettre en pièce-jointe en postant ici ? (sur ce forum, tu peux ajouter des pièces jointes aux messages que tu poste).
Tu as la certitude acquise et absolue que ce template est associé au type de document que tu éditais sur ce site ?
------------------------------------------------------------
Sur le web, c'est la liberté qui est gratuite, mais bien évidement pas la consomation ... et encore moins la consomation à outrance
------------------------------------------------------------
Language shapes the way we think, and determines what we can think about [ B. Lee Whorf ] ... mais ce n'est pas tout à fait vrai à 100%...
------------------------------------------------------------
Pascal (FreePascal?) - Ada (Gnat-3.15p)
XSLT (XSLTProc) - CGI binaires (Ada/C) [ Clavier Arabe ]
------------------------------------------------------------
alors voilà :
je sors du labyrinthe, je vais me débrouiller avec des copier coller manuels, plutôt que d'improbables essais complètement hors de mes compétences.
merci pour le dialogue, et bon we.
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager