Bonjour à tous,
Je cherche à faire du parsing de document word qui contiennent des tableaux.
J'ai fait quelques recherches et voila ce que je pense faire. Je pense qu'il existe d'autre façon plus rapide mais je n'en suis pas sur.
Parsing d'un fichier word :
- Convertir le document .doc en .docx
- Extraire le .docx
- lire le fichier fichier/word/document.xml
- Extraire les informations intéressantes
Cependant j'ai quelques difficulté pour comprendre les balises présentent dans le document.xml. Est-ce que vous avez une documentation à ce sujet ou des informations pouvant m'aider.
Merdi d'avance![]()
Partager