-
OCR sous python
Bonjour,
je cherche un moyen de faire de la reconnaissance de caractère sous pyhton, via une bibliothèque libre.
J'ai vu qu'il existait pytesser et python-tesseract, qui appellent simplement le logiciel tesseract, mais ces codes impliquent de passer par la création/lecture de fichiers temporaire d'image là où je cherche plutôt quelque chose qui me permette de travailler directement en mémoire.
Il faudrait sans doute que je travaille directement avec l'API de tesseract, donc que je 'wrap' les appels C/C++ vers python.
Mais je n'ai jamais utilisé ctype pour le moment et j'ai un peu peur de m'y lancer, de plus je ne trouve pas de documentation pour l'API de tesseract elle même.
Donc ma question est:
quelqu'un ici a-t-il une expérience à partager sur l'utilisation d'OCR depuis python ? Des conseils pour une autre bibliothèque à utiliser ? Bref, je suis preneur d'avis dans les jours qui suivent avant de me lancer sur tesseract.
Merci d'avance.
David GUEZ
-
Bonjour,
Je viens de lire votre message.
Avez-vous un retour d'expérience à partager (même très rapide!) pour de l'OCR avec Python ?
Merci à vous,
XR
-
Bonjour,
A vrai dire, rien de nouveau depuis ce message. J'ai un peu procrastiné l'utilisation de l'OCR dans mon projet pour l'instant, mais je pense que je ne couperais pas à l'utilisation de tesseract avec création de fichier image puis texte temporaire à la volée. C'est pas si grave d'ailleurs, mais ce n'est pas très propre (sans compter les problèmes de sécurité que cela implique).
Désolé mais je n'ai rien de mieux...