|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
Bonjour,
je cherche à extraire le texte d'un fichier pdf. Je sais qu'il existe pdf2txt mais d'après ce que j'ai pu voir, c'est payant. Est ce qu'il existe une fonction ou une classe qui le fait? J'ai trouvé pour les .doc et les .xls maintenant je cherche pour .pdf Merci d'avance Sandra |
|
|
00
|
|
|
#2 |
|
Membre éclairé
![]() Inscription : janvier 2004 Messages : 424 ![]() |
si tu es sur un serveur ou tu peux ajouter des executables, tu as ca :
pdftotext c'est un executable que est une partie de xpdf.. http://www.foolabs.com/xpdf/ tu as juste a extraire l'executable en question de xpdf (pas besoin de tout installer) et de l'appeller depuis la ligne de commande.. ou un script php, avec "exec" |
|
|
00
|
|
|
#3 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
J'ai télechargé à partir de l'adresse que tu m'as donné mais je ne trouve pas pdftotext?
|
|
|
00
|
|
|
#4 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
J'ai trouvé : pdftotext.cc
je l'ai copié sur mon serveur et j'ai fait ç : et j'ai l'erreur suivante : Warning: exec(): Unable to fork [pdftotext documents/calendrier.pdf] in F:\DirInfo\PHP\GRH\Salarie\ged.php on line 68 Sandra |
|
|
00
|
|
|
#5 |
|
Membre éclairé
![]() Inscription : janvier 2004 Messages : 424 ![]() |
hmm.. ca a ptet evolué, moi j'avais trouvé un pdftotext mais pas en .cc
c'etait un executable.. je vais chercher voir si je le retrouve sur le net ou dans mes archives |
|
|
00
|
|
|
#6 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
Si tu l'as ça serait génial!!!!!!
Sandra |
|
|
00
|
|
|
#7 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
c'est pas grave
|
|
|
00
|
|
|
#8 |
|
Membre éclairé
![]() Inscription : janvier 2004 Messages : 424 ![]() |
ok, il est dans l'archive precompilée, normal..
http://www.foolabs.com/xpdf/download.html x86, Linux (glibc 2.2, staticly linked to Motif, t1lib, and FreeType): xpdf-3.01pl2-linux.tar.gz (5604272 bytes) et dedans tu as un pdftotext, sans extension, c'est celui la, je viens de tester.. |
|
|
00
|
|
|
#9 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
Mais je ne suis pas sous linux
ça va marcher qd même? |
|
|
00
|
|
|
#10 |
|
Membre éclairé
![]() Inscription : janvier 2004 Messages : 424 ![]() |
aie.. lol
tu as celle la, aussi .. x86, DOS/Win32 -- pdftops, pdftotext, pdfimages, pdfinfo, and pdffonts only: Win32 (built with MSVC): xpdf-3.01pl2-win32.zip (1679081 bytes) et dedans tu dois avoir un pdftotext.exe |
|
|
00
|
|
|
#11 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
Ok merci.
J'ai téléchargé et essayé et j'ai l'erreur suivante Warning: exec(): Unable to fork [pdftotext.exe documents/calendrier.pdf] in F:\DirInfo\PHP\GRH\Salarie\ged.php on line 69 Ma ligne 69 c'est ça : Code :
exec ("pdftotext.exe ".$nomfichierupload); Sandra |
|
|
00
|
|
|
#12 |
|
Membre éclairé
![]() Inscription : janvier 2004 Messages : 424 ![]() |
deja je peux te dire qu'il te manque un parametre... vu que pdftotext, tu dois lui indiquer le doc pdf mais aussi la sortie texte..
Pour le reste etant sous linux, je ne peux pas t'aider plus.. Bon courage PS. tu peux deja essayer en ligne de commande, pour voir si ca marche correctement.. |
|
|
00
|
|
|
#13 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2003 Messages : 66 ![]() |
J'ai ajouté le paramètre qui me manquait mais j'ai tjs la même erreur
Est ce que qq1 peut m'aider? Merci d'avance Sandra PS: merci pour ton aide zevince |
|
|
00
|
|
|
#14 |
![]() ![]() Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Analyste Programmeur Inscription : mars 2002 Messages : 30 079 ![]() |
je suis sous windows et j'ai globalement le même souci.
en ligne de commande depuis le console cmd il me génère bien le fichier texte, mais pas moyen de le faire tourner depusi php et encore moins de recupérer le texte
__________________
Ma page Developpez Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts) Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir... Votre post est résolu ? Alors n'oubliez pas le Tag ![]() ![]() réalisations :www.planet-languages.com|www.saftair.com| www.ouestisol.fr | www.sebemex.fr | www.extramiante.fr | www.sistac-alizay.fr | www.acoustishop.fr | www.litt.fr | www.ouestventil.fr |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com