Bonsoir,
Je cherche comment spécifier la récupération des données depuis un document pdf (plus de 50 pages) et les enregistrées dans la BD . c'est- à- dire, j'ai dans le document des paragraphes comme ceci:
Donc j'en sais pas comment créer un algorithme qui récupérer le grand titre seulement (1 Patching and Software Updates) et stocker dans une variable, le sous titre (1.1 Install Updates, Patches and Additional Security Software (Not Scored)) et le mettre dans une autre variable.1. Patchs et mises à jour logicielles
1.1 Installer les mises à jour, les correctifs et les logiciels de sécurité supplémentaires (non évalués)
Applicabilité du profil:
Level 1
Description:
Les correctifs périodiques sont publiés pour les logiciels inclus, soit en raison de défauts de sécurité, soit pour inclure des fonctionnalités supplémentaires ....
D’après une recherche sur l'internet ,j'ai trouvé la librairie "pdfbox" qui facilite l'extraction des données et le parcoure du document PDF.
Alors , j'ai appliqué cette biblio et j'ai bien extraire les données du fichier FDF. Voilà mon code:
J'ai eu des problèmes dans la spécification des données à récupérer?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27 public Boolean ExtractPDF() { try { String filename = "CIS_Ubuntu_12.04_LTS.pdf"; String directory = "src/main/resources/static/pdf"; String filepath = Paths.get(directory, filename).toString(); System.out.println("*********** path file pdf "+filepath); PDDocument document = null; document = PDDocument.load(new File(filepath)); document.getClass(); if (!document.isEncrypted()) { PDFTextStripperByArea stripper = new PDFTextStripperByArea(); stripper.setSortByPosition(true); PDFTextStripper Tstripper = new PDFTextStripper(); String st = Tstripper.getText(document); System.out.println("********Text:***** " +st); // j'ai le texte du document PDF } } catch (Exception e) { e.printStackTrace(); } return true; }
Merci de m'aider à trouver la bonne solution,
Partager