Bonjour, j'utilises 2 API différentes mais qui peuvent être complémentaires: Lucene (gestion d'un index plein texte) et PDFBox (je vous laisse deviner...)
PDFBox permet de générer directement un document exploitable par Lucene (ce qui m'intéresse) à partir d'un fichier PDF (que j'ai (presque) en entrée).
En réalité, je n'ai pas le fichier PDF en lui-même, mais un byte[] correspondant aux données du fichier PDF.
PDFBox me fournit donc une méthode statique qui prend en argument un InputStream, un File ou une URL. Des 3 je ne peux utiliser que l'InputStream car je n'ai pas accès au fichier.
Voici mon appel:
Voici l'erreur qui me tombe dessus:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 temporaryLuceneDoc = LucenePDFDocument.getDocument( ( InputStream )( new ByteArrayInputStream( fichierPhysique.getDonnees( ) ) ) );
J'ai essayé avec ou sans le cast en InputStreamLe message d'erreur est : org.apache.lucene.document.Field.Text(Ljava/lang/String;Ljava/io/Reader; )Lorg/apache/lucene/document/Field;
Le tracé de pile est :
java.lang.NoSuchMethodError: org.apache.lucene.document.Field.Text(Ljava/lang/String;Ljava/io/Reader; )Lorg/apache/lucene/document/Field;
at org.pdfbox.searchengine.lucene.LucenePDFDocument.addContent(LucenePDFDocument.java:290)
at org.pdfbox.searchengine.lucene.LucenePDFDocument.getDocument(LucenePDFDocument.java:148)
Partager