-
Parsing document word
Bonjour à tous,
Je cherche à faire du parsing de document word qui contiennent des tableaux.
J'ai fait quelques recherches et voila ce que je pense faire. Je pense qu'il existe d'autre façon plus rapide mais je n'en suis pas sur.
Parsing d'un fichier word :
- Convertir le document .doc en .docx
- Extraire le .docx
- lire le fichier fichier/word/document.xml
- Extraire les informations intéressantes
Cependant j'ai quelques difficulté pour comprendre les balises présentent dans le document.xml. Est-ce que vous avez une documentation à ce sujet ou des informations pouvant m'aider.
Merdi d'avance :)
-
Tu as PHPWord qui peut t'interesser
http://phpword.codeplex.com/
-
Merci pour ta réponse.
J'ai déjà vu la librairie mais celle-ci créé des documents words à partir de php, elle ne lit pas les documents qui lui sont envoyés.