Tesseracte ocr sur visual studio c++
Bonsoir à tous.
J'ai su intégré tesseract ocr sur visual studio c++ 2008.J'ai juste eu un souci au niveau de l'extraction du texte.Le texte extrait (en anglais) n'est restitué qu'à 80% mais il est moins bon(je dirais même catastrophique ,avec 2% des mots en bonne uniformité) lorsque le document scanné est écrit en Français.Evidement j'ai renseigné à la fonction
le dossier tessdata qui contient les fichiers associés au langage du texte :
Code:
1 2
| tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
api->Init("C:\tesseract-mingw-master\tessdata", "fra", tesseract::OEM_DEFAULT) |
.
Comment puis-je faire pour avoir une extraction plus ou moins à 90% du document scanné ??Y'aurait t-il d'autres ocr que je pourrais intégrer sur visula studio c++ plus performant que tesseract??Merci pour vos réponses. :)