Bonsoir,
je travaille sur l'analyse des CVs non structurés (pdf, word.......) je vais
utiliser l'analyseur treetagger qui a pour entrée un fichier texte.
Donc j'ai besoin de convertir les CVs au format word ou pdf en format texte (en java).
j'ai cherché mais j'ai trouvé qu'un seul package qui est payant (officetools.officefile)
S'il vous plaît si quelqu'un a une idée à propos de ce truc qu'il m'aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 import officetools.OfficeFile; // available at dancrintea.ro/xls-to-pdf/ ... FileInputStream fis = new FileInputStream(new File("test.xls")); FileOutputStream fos = new FileOutputStream(new File("test.csv")); OfficeFile f = new OfficeFile(fis,"localhost","8100", true); f.convert(fos,"csv");
Merci d'avance
Partager