IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Documents Java Discussion :

problème couplage PDFBox / Lucene


Sujet :

Documents Java

  1. #1
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    8
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Mai 2007
    Messages : 8
    Points : 6
    Points
    6
    Par défaut problème couplage PDFBox / Lucene



    Bonjour, j'utilises 2 API différentes mais qui peuvent être complémentaires: Lucene (gestion d'un index plein texte) et PDFBox (je vous laisse deviner...)
    PDFBox permet de générer directement un document exploitable par Lucene (ce qui m'intéresse) à partir d'un fichier PDF (que j'ai (presque) en entrée).
    En réalité, je n'ai pas le fichier PDF en lui-même, mais un byte[] correspondant aux données du fichier PDF.
    PDFBox me fournit donc une méthode statique qui prend en argument un InputStream, un File ou une URL. Des 3 je ne peux utiliser que l'InputStream car je n'ai pas accès au fichier.
    Voici mon appel:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    temporaryLuceneDoc = LucenePDFDocument.getDocument(
     ( InputStream )( new ByteArrayInputStream( fichierPhysique.getDonnees(  ) ) ) );
    Voici l'erreur qui me tombe dessus:
    Le message d'erreur est : org.apache.lucene.document.Field.Text(Ljava/lang/String;Ljava/io/Reader; )Lorg/apache/lucene/document/Field;
    Le tracé de pile est :

    java.lang.NoSuchMethodError: org.apache.lucene.document.Field.Text(Ljava/lang/String;Ljava/io/Reader; )Lorg/apache/lucene/document/Field;
    at org.pdfbox.searchengine.lucene.LucenePDFDocument.addContent(LucenePDFDocument.java:290)
    at org.pdfbox.searchengine.lucene.LucenePDFDocument.getDocument(LucenePDFDocument.java:148)
    J'ai essayé avec ou sans le cast en InputStream

  2. #2
    Membre à l'essai
    Inscrit en
    Février 2003
    Messages
    22
    Détails du profil
    Informations forums :
    Inscription : Février 2003
    Messages : 22
    Points : 20
    Points
    20
    Par défaut
    essaye d'utiliser ceci :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    LucenePDFDocument.getDocument( new File("NOM DU FICHIER PDF");
    C'est comme cela que j'utilise la class LucenePDFDocument.

  3. #3
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    8
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Mai 2007
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    non en fait j'ai trouvé d'où vient l'erreur: getDocument utilise une fonction Lucene... qui n'existe pas (ou plus), en l'occurence la classe Filed.Text (d'où l'erreur)
    Et je ne peux pas utiliser getDocument(File xxx) car je n'ai pas accès au document proprement dit. J'ai accès au fichier par une base de données, qui contient les données du fichier PDF mais pas le fichier à proprement parlé. Je récupère ces données sous forme d'un tableau de byte, la seule manière d'utiliser getdocument est donc de passer par un ByteArrayInputStream.

  4. #4
    Membre à l'essai
    Inscrit en
    Février 2003
    Messages
    22
    Détails du profil
    Informations forums :
    Inscription : Février 2003
    Messages : 22
    Points : 20
    Points
    20
    Par défaut
    ok
    Je travaille encore avec la version 2.0 et là cela fonctionne.
    Je vais essayer la version 2.1 peut-être que la nv. version peut m'aider avec mon prob.

  5. #5
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    8
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Mai 2007
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    je suis pourtant avec la version 2.0.0 de Lucene...
    par contre je n'ai pas la dernière version de pdfbox (0.7.4) mais une version précédente (0.7.1)
    laquelle utilise-tu?

  6. #6
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    8
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Mai 2007
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    j'ajoute que je suis restreint par l'utilisation de Maven, or ces derniers utilisent la version 0.7.1 (qui date quand même d'avril 2005 )
    je vais faire une demande pour qu'ils passent à une version plus récente

  7. #7
    Membre à l'essai
    Inscrit en
    Février 2003
    Messages
    22
    Détails du profil
    Informations forums :
    Inscription : Février 2003
    Messages : 22
    Points : 20
    Points
    20
    Par défaut
    j'utilise la version 0.7.4.

  8. #8
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    8
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Mai 2007
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    c'est bon j'ai résolu mon problème, mais j'ai du bidouiller mon repository maven local pour y mettre le version 0.7.3 de PDFBox ainsi qu'une des librairies utilisée par l'API (FontBox) afin que ça marche correctement.
    Entretemps, j'ai aussi demandé à M. Litchfield pour qu'il intègre la version 0.7.3 à Maven (la 0.7.1 date de presque 2 ans )
    en tout cas merci d'avoir répondu

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [1.x] problème avec Zend Lucene Framework et symfony
    Par flora806 dans le forum Symfony
    Réponses: 2
    Dernier message: 12/05/2011, 15h45
  2. [1.x] Problème recherche Zend Lucene
    Par Despecrew dans le forum Symfony
    Réponses: 1
    Dernier message: 03/03/2011, 10h56
  3. [Lucene][PdfBox] prob. de résultat de recherche
    Par shinchun dans le forum Documents
    Réponses: 2
    Dernier message: 24/03/2009, 13h57
  4. problème de couplage triparti
    Par lyxthe dans le forum Algorithmes et structures de données
    Réponses: 4
    Dernier message: 28/09/2007, 16h30
  5. Problème authentification avec couplage Apache/Tomcat
    Par arN34 dans le forum Tomcat et TomEE
    Réponses: 1
    Dernier message: 28/05/2007, 10h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo