|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Candidat au titre de Membre du Club
![]() Inscription : mars 2008 Messages : 91 ![]() |
Bonjour,
Je recherche un programme de reconnaissance optique des caractères pour Ubuntu 10.10 afin de convertir un scan PDF en texte. Mon problème c'est qu'avec tout ceux que je trouve, il n'est possible de convertir qu'une page à la fois ce qui est assez pénible. Existe-t-il un moyen de convertir tout le PDF d'un coup? Merci ;-) |
|
|
00
|
|
|
#2 |
|
Expert Confirmé Sénior
![]() francois Ingénieur systèmes et réseaux Inscription : juillet 2006 Messages : 3 534 ![]() |
solution de flémard :
pdf2jpeg ou tout autre convertion en images imagemagic pour "traiter les images" augmenter le contraste pour un meilleur traiterment OCR OCR tu scriptes le tout et tu as un fichier texte brut, tu lance un correcteur orthographique par derrière pour trouver les mots et expressions mal reprises, et paf y'a plus qu'a mettre en forme personellement j'avais fait ça y'a 1 ou 2 ans pour un dossier d'une centaine de page, le script avait tourné genre toute la nuit et le matin vers midi j'avais fini la correction du texte |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com