conversion word en texte et pdf en texte
Bonsoir,
je travaille sur l'analyse des CVs non structurés (pdf, word.......) je vais
utiliser l'analyseur treetagger qui a pour entrée un fichier texte.
Donc j'ai besoin de convertir les CVs au format word ou pdf en format texte (en java).
j'ai cherché mais j'ai trouvé qu'un seul package qui est payant (officetools.officefile)
Code:
1 2 3 4 5 6 7
|
import officetools.OfficeFile; // available at dancrintea.ro/xls-to-pdf/
...
FileInputStream fis = new FileInputStream(new File("test.xls"));
FileOutputStream fos = new FileOutputStream(new File("test.csv"));
OfficeFile f = new OfficeFile(fis,"localhost","8100", true);
f.convert(fos,"csv"); |
S'il vous plaît si quelqu'un a une idée à propos de ce truc qu'il m'aide.
Merci d'avance