IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Parsing de word ?


Sujet :

Langage PHP

  1. #1
    Invité
    Invité(e)
    Par défaut Parsing de word ?
    Bonjour,

    J'ai une demande de la part de mon manager et je ne sais pas si cela est réalisable et en combien de temps ?

    1) Parsing de docx
    Récupérer de façon automatique le contenu d'un fichier .docx, c'est à dire les tableaux, le texte avec la mise en forme (gras, surligné, police …) , les balises ainsi que les images.

    Le texte récupéré devra ensuite être affiché dans une application en ligne et permettre l’affichage de ce contenu.
    La fonctionnalité sera intégrée à une application qui sera mise en production.

    2) Récupération à partir de fichier .docx
    Récupération du contenu d’un fichier .docx par copier, c'est à dire les tableaux, le texte avec la mise en forme (gras, surligné, police …) , les balises ainsi que les images.
    Puis collage de ses informations dans la fenêtre d’une application en ligne. Le texte, la mise-en-forme et le placement des images doit être sauvegardé.

    Le texte récupéré devra ensuite être affiché dans une application en ligne et permettre l’affichage de ce contenu.
    La fonctionnalité sera intégrée à une application qui sera mise en production.

  2. #2
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    C'est possible, ça existe meme déjà :
    http://word2cleanhtml.com/
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  3. #3
    Invité
    Invité(e)
    Par défaut
    Désolé pour le délai de réponse.

    @sabotage
    Je cherchais alors une bibliothèque.

    La bibliothèque gratuite la plus riche est PHPWord. Elle permet de récupérer une variable dom du document *.docx et de récupérer les informations que l'on souhaite. La bibliothèque a été démarrée en 2008, elle n'est pas sortie en version release (1.x), le développement a même été interrompu pendant plusieurs année.

    Fort heureusement, il a redémarré il y a peu grâce à un fork sur github. (https://github.com/PHPOffice/PHPWord). Elle reste cependant incomplète notamment vis-à-vis des traitements très spécifiques comme la récupération d'images dans un tableau, la génération de tableau avec des images, la récupération des styles dans des styles etc.

    Néanmoins il s'agit d'une très bonne bibliothèque qui satisfera la plupart des usages simples comme récupérer du texte et quelques images.

Discussions similaires

  1. Parsing document word
    Par Invité dans le forum Langage
    Réponses: 2
    Dernier message: 14/01/2014, 12h05
  2. Réponses: 3
    Dernier message: 14/11/2009, 09h26
  3. Lecture & parsing de fichier word
    Par Mastah dans le forum Documents
    Réponses: 2
    Dernier message: 06/11/2008, 11h31
  4. StringGrid, multiligne et word wrap
    Par Dajon dans le forum C++Builder
    Réponses: 7
    Dernier message: 17/09/2003, 17h15
  5. [VBA-W] [Word] Insérer une image MSChart
    Par fredo1664 dans le forum VBA Word
    Réponses: 2
    Dernier message: 20/11/2002, 09h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo