Bonjour,
j'ai une question bete a poser.
comment faire pour charger le contenu d'un fichier pdf.
j'ai essayé avec "file_get_contents" mais ca me donne un résultat pas tres tres jolie...
Bonjour,
j'ai une question bete a poser.
comment faire pour charger le contenu d'un fichier pdf.
j'ai essayé avec "file_get_contents" mais ca me donne un résultat pas tres tres jolie...
Comment ça "pas très joli" ?
en gros j'ai plus de forme géométrique que de lettre
et du coup pour faire une recherche dans ce contenu ce n'est pas tres évident
Peux-tu nous montrer ce que tu fais et nous dire plus precisemment ce que tu obtiens ?
ce soir je ne vais pas pouvoir, j'ai le code au boulot !
mais en gros j'utilise le framework Zend et notamment Zend_lucene pour le moteur de recherche.
donc je commence pas créer mon index
puis mon document, j'y ajoute un titre, une URL, et un contenu.
j'ajoute ensuite ce document a mon index.
Ensuite je fais une recherche avec Zend_recherche.
Mais le truc, c'est que si je recherche un mot présent dans le titre ca le trouve.
par contre si je le cherche dans mon contenu ca plante, meme si le mot est effectivement présent dans le document !
Salut,
C'est poissible, tu dois utiliser des librairies spécialisée tel que fpdi.
je me suis mal exprimer...
ce que je veux c'est mettre le contenu "textuel" de mon pdf dans une variable "string" on va dire... pour pouvoir y faire une recherche dedant...
- j'ai pas l'impression que cette librairie fasse ca, mais je peux me tromper
- par contre j'ai trouvé pdftotext de xpdf... par contre j'ai quelque souci de compréhension par rapport a son "installations" sous windows
qq'un aurais qq conseils a me donner...
Partager