pdfbox chercher un mot dans un pdf
Bonjour tout le monde :)
je voudrais réaliser un programme qui fait la recherche des mots dans un pdf
en utilisant le pdfbox (appach.pdfbox librairie)
voici mon petit programme
Code:
1 2 3 4 5 6
| List<String> words = null ;// List of words
PDDocument document = PDDocument.load("D:\\INIT.pdf");
PDFTextStripper s = new PDFTextStripper();
String content = s.getText(document);
comparing(content,words);//methode for searching those words on my text
System.out.println(content); |
mais il y a une doute dans ma tete :(
1) est il possible de chercher directement dans le pdf sans avoir le text avec getText
2) getText retourne un string "peut il supporter tous le texte dans le pdf ?? " dans le cas
Merci d'avance :ccool: