Bonsoir à tous.
J'ai su intégré tesseract ocr sur visual studio c++ 2008.J'ai juste eu un souci au niveau de l'extraction du texte.Le texte extrait (en anglais) n'est restitué qu'à 80% mais il est moins bon(je dirais même catastrophique ,avec 2% des mots en bonne uniformité) lorsque le document scanné est écrit en Français.Evidement j'ai renseigné à la fonction
le dossier tessdata qui contient les fichiers associés au langage du texte :
Code c++ : Sélectionner tout - Visualiser dans une fenêtre à part Init(..)
.
Code c++ : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI(); api->Init("C:\tesseract-mingw-master\tessdata", "fra", tesseract::OEM_DEFAULT)
Comment puis-je faire pour avoir une extraction plus ou moins à 90% du document scanné ??Y'aurait t-il d'autres ocr que je pourrais intégrer sur visula studio c++ plus performant que tesseract??Merci pour vos réponses.
Partager