IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PHP & Base de données Discussion :

Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc [MySQL]


Sujet :

PHP & Base de données

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    71
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 71
    Points : 41
    Points
    41
    Par défaut Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc
    Bonjour,

    Pour les besoins de mon site j'ai créé un moteur de recherche qui, en fonction du ou des mots choisis par l'utilisateur, va chercher dans la base le ou les articles correpondants. Je voudrais en plus rajouter une fonctionnalité qui irait chercher à l'intérieur d'un document pdf ou d'un .doc.

    Est-ce possible ? Si oui, comment ?? Est-ce du php ?


    Merci d'avance pour votre aide

  2. #2
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    Pour faire ça j'ai utilise Antiword et Pdftotext.
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    71
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 71
    Points : 41
    Points
    41
    Par défaut Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc
    Merci de ta reponse super rapide

    Antiword et Pdftotext, c'est des logiciels. Moi je voudrais un outil que je puisse intégrer dans une fonction php, javascript (ou autre). Je ne sais pas s'il est possible "d'intégrer un logiciel" à une fonction, mais en tout cas ça ne me semble pas une bonne idée car tous les utilisateurs du site auront besoin d'installer ces logiciels (oui ce n'est pas un site perso).

    Par contre pour mon usage perso ca pourrait me servir

  4. #4
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    Ce sont des logiciels en ligne de commande, ils peuvent donc être utilisés par PHP depuis le serveur.
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  5. #5
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    71
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 71
    Points : 41
    Points
    41
    Par défaut Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc
    ah ok !

    est-ce que ca implique d'installer le logiciel sur le serveur ??

    Une chose est sure, il ne faut pas que les utilisateurs du site aient à installer quoi que ce soit.

  6. #6
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    ils doivent être présents sur le serveur, mais il n'y a pas d'installation au sens windows.
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  7. #7
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    71
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 71
    Points : 41
    Points
    41
    Par défaut Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc
    Ca veut dire que je n'ai qu'à copier les fichiers sur l'espace qui m'est réservé sur le serveur, les mettre à la racine ou dans un dossier (n'importe lequel), et quand j'en aurai besoin les appeler à partir de ce dossier ?

    J'espère que c'est pas trop bête comme question mais je voudrais être sûr d'avoir bein compris !!

  8. #8
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    Sous reserve que ton hebergeur t'ai donné les droits d'execution.
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  9. #9
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    71
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 71
    Points : 41
    Points
    41
    Par défaut Rechercher un mot à l'intérieur d'un fichier .pdf ou .doc
    Ok merci c'est ce que je voulais savoir.

    Bon ben je vais chercher du côté de ces logiciels alors .

    Je mets donc la discussion à résolu, et si jai des problèmes avec ma fonction je te fais signe !! Si bien sur j'arrive à avoir les droits d'exécution, ce qui je le pense, n'est pas gagné...


    MErci de ton aide sabotage et a +

  10. #10
    Futur Membre du Club
    Homme Profil pro
    Multi casquettes
    Inscrit en
    Avril 2018
    Messages
    15
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Multi casquettes
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2018
    Messages : 15
    Points : 6
    Points
    6
    Par défaut
    Bonjour,

    merci pour les solutions proposées (même datant d'il y a 10 ans)
    Elles fonctionnent encore parfaitement et je voulais juste faire un retour d'expérience, car c'est très simple.

    1/ Pdftotext est un outil Linux faisant partie du module "poppler-utils".
    il y a de fortes chances pour qu'il soit déjà installé sur votre serveur, sinon il faut l'installer en ligne de commande sur votre serveur en tapant $ "sudo apt-get install poppler-utils"
    (voir doc ici selon vos distributions : https://www.cyberciti.biz/faq/conver...ormat-command/)

    2/ pdfTotext s'invoque en ligne de commande avec la syntaxe "pdftotext mondoc.PDF Text.txt". Pour lancer une ligne de commande en PHP, il suffit d'utiliser la fonction exec():
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $command = "pdftotext  mondoc.PDF Text.txt"; 
    exec($command);
    En fait ce n'est pas juste aussi simple que ça car il faut être dans le bon dossier pour lire le PDF et le transfomer en txt, donc on va concaténer 2 commandes en une :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
        $command1 = "cd "."$file_folder/"; // on se place au bon endroit
        $command2 = "pdftotext -enc Latin1 mondoc.PDF Text.txt"; // j'ajoute un encodage Latin1
        exec($command1." && ".$command2);
    on peut ajouter des encodages à la conversion, pratique selon la tête de votre PDF d'origine (impossible de convertir les € dans mon cas, l'encodage iso-8859-15n'est pas disponible

    3/ on accède on contenu du fichier via un petit file_get_contents()
    $text = file_get_contents($file_folder."/texte.txt");
    et on peut détruire cet encombrant fichier texte
    unlink ($file_folder."/texte.txt");

    4/ maintenant on a une variable pleine de texte, à vous d'y faire les recherches que vous voulez.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Affichage des fichier pdf ou doc sur ma page
    Par scaryfan dans le forum JSF
    Réponses: 4
    Dernier message: 25/09/2009, 13h54
  2. insérer un lien (rattaché) vers un fichier pdf ou doc
    Par devlopassion dans le forum Word
    Réponses: 4
    Dernier message: 07/12/2008, 16h49
  3. Générer un fichier pdf ou doc avec du pl/sql
    Par felosa dans le forum PL/SQL
    Réponses: 5
    Dernier message: 19/09/2008, 18h34
  4. lire et générer des fichiers pdf et doc
    Par aziz jim dans le forum wxWidgets
    Réponses: 3
    Dernier message: 12/11/2006, 17h03
  5. Convertir un fichier ps en un fichier pdf ou doc
    Par angsthase dans le forum Autres Logiciels
    Réponses: 2
    Dernier message: 24/10/2005, 18h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo