Précédent   Forum des professionnels en informatique > PHP > Bibliothèques et frameworks > PDF > FPDF
FPDF Forum d'entraide pour la bibliothèque FPDF permettant de générer des documents PDF en PHP. Avant de poster -> tutoriels FPDF
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 23/03/2006, 12h31   #1
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
Par défaut [FPDF] Extraire le texte d'un pdf

Bonjour,

je cherche à extraire le texte d'un fichier pdf.
Je sais qu'il existe pdf2txt mais d'après ce que j'ai pu voir, c'est payant.

Est ce qu'il existe une fonction ou une classe qui le fait?
J'ai trouvé pour les .doc et les .xls maintenant je cherche pour .pdf

Merci d'avance
Sandra
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 14h44   #2
Membre éclairé
 
Inscription : janvier 2004
Messages : 424
Détails du profil
Informations personnelles :
Âge : 39
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : janvier 2004
Messages : 424
Points : 311
Points : 311
si tu es sur un serveur ou tu peux ajouter des executables, tu as ca :
pdftotext
c'est un executable que est une partie de xpdf..

http://www.foolabs.com/xpdf/

tu as juste a extraire l'executable en question de xpdf (pas besoin de tout installer) et de l'appeller depuis la ligne de commande.. ou un script php, avec "exec"
zevince est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 14h51   #3
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
J'ai télechargé à partir de l'adresse que tu m'as donné mais je ne trouve pas pdftotext?
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h13   #4
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
J'ai trouvé : pdftotext.cc
je l'ai copié sur mon serveur et j'ai fait ç :

Code :
1
2
 
 exec ('pdftotext '.$nomfichier);
et j'ai l'erreur suivante :

Warning: exec(): Unable to fork [pdftotext documents/calendrier.pdf] in F:\DirInfo\PHP\GRH\Salarie\ged.php on line 68



Sandra
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h21   #5
Membre éclairé
 
Inscription : janvier 2004
Messages : 424
Détails du profil
Informations personnelles :
Âge : 39
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : janvier 2004
Messages : 424
Points : 311
Points : 311
hmm.. ca a ptet evolué, moi j'avais trouvé un pdftotext mais pas en .cc

c'etait un executable..

je vais chercher voir si je le retrouve sur le net ou dans mes archives
zevince est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h23   #6
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
Si tu l'as ça serait génial!!!!!!

Sandra
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h26   #7
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
c'est pas grave
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h27   #8
Membre éclairé
 
Inscription : janvier 2004
Messages : 424
Détails du profil
Informations personnelles :
Âge : 39
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : janvier 2004
Messages : 424
Points : 311
Points : 311
ok, il est dans l'archive precompilée, normal..

http://www.foolabs.com/xpdf/download.html
x86, Linux (glibc 2.2, staticly linked to Motif, t1lib, and FreeType):
xpdf-3.01pl2-linux.tar.gz (5604272 bytes)

et dedans tu as un pdftotext, sans extension, c'est celui la, je viens de tester..
zevince est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h30   #9
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
Mais je ne suis pas sous linux

ça va marcher qd même?
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h36   #10
Membre éclairé
 
Inscription : janvier 2004
Messages : 424
Détails du profil
Informations personnelles :
Âge : 39
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : janvier 2004
Messages : 424
Points : 311
Points : 311
aie.. lol

tu as celle la, aussi ..
x86, DOS/Win32 -- pdftops, pdftotext, pdfimages, pdfinfo, and pdffonts only:
Win32 (built with MSVC): xpdf-3.01pl2-win32.zip (1679081 bytes)

et dedans tu dois avoir un pdftotext.exe
zevince est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h42   #11
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
Ok merci.

J'ai téléchargé et essayé et j'ai l'erreur suivante


Warning: exec(): Unable to fork [pdftotext.exe documents/calendrier.pdf] in F:\DirInfo\PHP\GRH\Salarie\ged.php on line 69


Ma ligne 69 c'est ça :

Code :
 exec ("pdftotext.exe ".$nomfichierupload);
qq 1 a eu le même pb?

Sandra
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 15h47   #12
Membre éclairé
 
Inscription : janvier 2004
Messages : 424
Détails du profil
Informations personnelles :
Âge : 39
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : janvier 2004
Messages : 424
Points : 311
Points : 311
deja je peux te dire qu'il te manque un parametre... vu que pdftotext, tu dois lui indiquer le doc pdf mais aussi la sortie texte..
Pour le reste etant sous linux, je ne peux pas t'aider plus..
Bon courage

PS. tu peux deja essayer en ligne de commande, pour voir si ca marche correctement..
zevince est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2006, 16h29   #13
Candidat au titre de Membre du Club
 
Inscription : mars 2003
Messages : 66
Détails du profil
Informations forums :
Inscription : mars 2003
Messages : 66
Points : 13
Points : 13
J'ai ajouté le paramètre qui me manquait mais j'ai tjs la même erreur
Est ce que qq1 peut m'aider?

Merci d'avance
Sandra

PS: merci pour ton aide zevince
SandraG est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/10/2009, 14h48   #14
Rédacteur/Modérateur
 
Avatar de SpaceFrog
 
Homme
Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Analyste Programmeur
Inscription : mars 2002
Messages : 30 079
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Royaume-Uni

Informations professionnelles :
Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Analyste Programmeur
Secteur : Industrie

Informations forums :
Inscription : mars 2002
Messages : 30 079
Points : 45 213
Points : 45 213
je suis sous windows et j'ai globalement le même souci.
en ligne de commande depuis le console cmd il me génère bien le fichier texte, mais pas moyen de le faire tourner depusi php et encore moins de recupérer le texte
__________________
Ma page Developpez
Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts)
Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir...
Votre post est résolu ? Alors n'oubliez pas le Tag


réalisations :www.planet-languages.com|www.saftair.com| www.ouestisol.fr | www.sebemex.fr | www.extramiante.fr | www.sistac-alizay.fr | www.acoustishop.fr | www.litt.fr | www.ouestventil.fr
SpaceFrog est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 17h59.


 
 
 
 
Partenaires

Hébergement Web