Salut,
j'ai un fichier PDF (20 pages) ou je n'ai que des tableaux, je voudrais remplir ces tableaux dans une base de données :( !
est ce qu'il est possible de lire ce PDF avec JAVA pour que je puisse le remplir en BDD avec des requetes SQL !
merci
Version imprimable
Salut,
j'ai un fichier PDF (20 pages) ou je n'ai que des tableaux, je voudrais remplir ces tableaux dans une base de données :( !
est ce qu'il est possible de lire ce PDF avec JAVA pour que je puisse le remplir en BDD avec des requetes SQL !
merci
Tu n'as pas d'autres formats possible ?
Avec un Excel, je peux t'aider, par contre un PDF, je ne connais pas d'API. Regarde du coté de iText
j'ai converti le pdf vers un text pour le ramener sous excel et CSV
le probleme c'est le separateur ! pasqu'une case d'un tableau peut contenir plusieur mots donc si je mets comme separateur l'espace ! chaque mot de cette case sera consideré comme un attribut :s :(:(
je vois pas comment prendre chaque case comme etant un attribut
mci
Si tu peux l'avoir en Excel, utilise l'api jexcel c'est assez simple. POI est mal aussi mais plus lourd
Bonjour,
Essai d'utiliser la tabulation comme séparateur, peut être que tu pourras mieux séparer tes cases ensuite. Ensuite pour ton insertion dans ton csv tu remplace tabulation par ";"
Il existe des API qui on des fonctionnalités d'extraction de texte contenu dans des fichiers PDF telles que PDFBox, ICEPDF et autres.
Là où le bat blesse est que le PDF en lui même n'a pas de concept de table, pour lui les tables sont juste des bouts de texte espacés, avec des lignes dessinées entre ces morceaux de texte. Le concept de table n'existe pas dans la spécification PDF.
Donc si tes tables sont bien placées (avec deux bookmarks positionnant début et fin de la l'espace représentant une table) ce pourrait être bidouillable. Sinon, bon courage...