Bonjour à tous,
Je cherche à lire un document word avec PHP.
Je ne sais pas du tout où m'orienter car je suis sous linux donc le composant COM ne fonctionnerais pas !
Merci pour vos réponses.
Cyrille
Version imprimable
Bonjour à tous,
Je cherche à lire un document word avec PHP.
Je ne sais pas du tout où m'orienter car je suis sous linux donc le composant COM ne fonctionnerais pas !
Merci pour vos réponses.
Cyrille
Je ne sais pas si cela est possible car un document Word, ça n'est pas seulement du texte. C'est aussi du code pour les polices, mise en forme, etc... Tu pourrais essayer de le lire comme un fichier texte (il y a des fonctions pour ça) mais je ne sais pas si ça marche
En effet, j'ai essayé de le lire comme un fichier texte mais il y a un paquet de caractères qui ne passent pas, comme tu me le disait, le formatage etc ...
Il s'agirait seulement de faire un lecture, et on m'a parlé d'XML mais je n'ai rien trouvé à ce sujet XML <=> Word.
Le texte est en clair dans le document lorsque je l'affiche mais perdu au milieu de ces caractères bizarroïdes. Que faire ?
Ne pourrais-je tout simplement pas faire un tri dans les données renvoyées ?
Merci pour vos réponses
Cyrille
Je ne peux pas t'aider désolé. As-tu cherché dans un moteur de recherche ? Je ne pense pas qu'on puisse trier les caractères...
Tu cherches à faire quoi avec le contenu du fichier Word ? Et d'où vient ce fichier ?
Je cherche à l'afficher en HTML.
Ces fichiers sont des CVs
Nous avons une base de 16000 CVs et nous procédons à leur indexation.
J'ai trouvé
Antiword est le logiciel parfait.
Un apercu du document est généré avec antiword -f ledocument
Merci à tous,
Cyrille