Bonjour,
Je souhaite présenter le projet Open Source sur lequel je travaille depuis quelques mois et qui traite le traitement d'images.
Sujet : Il s'agit de la Réalisation d'un système d'OCR appliqué à la reconnaissance automatique de l'indicateur chiffré d'un compteur d'énergie.
Définition : La reconnaissance optique de caractères (ROC) : ou encore appelé vidéocodage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l'être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps. Un ordinateur réclame pour l'exécution de cette tâche un logiciel de reconnaissance optique de caractères, ROC ou OCR (abréviation du terme anglais optical character recognition), Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou du moins, sur un support sûr et exploitable par un système informatique.
La reconnaissance de caractère est un domaine actif de recherche pour la science informatique depuis la fin des années 1950. Au début, on pensait qu'il s'agissait d'un problème facile, mais il apparut qu'il s'agissait d'un sujet beaucoup plus intéressant. Il faudra encore de nombreuses décennies aux ordinateurs, s'ils y parviennent un jour, pour lire tous les documents avec la même précision que les êtres humains.
Objectif : En partant d'un ensemble d'images obtenues par des capteurs sur les compteurs d'énergie, l'objectif est de lire les chiffres contenus sur ces dernières et ensuite générer un fichier CSV qui sera stocké dans la base de données.
Fonctionnalités :
1. Configuration de l'OCR.
1.a. Charger le répertoire d'images dans l'application.
1.b.Possibilité d'inverser(retourner de 180°) les images(il est possible qu'on fixe à contre sens le capteur d'images). (voir selection_region.png).
1.c. Possibilité de parcourir les images pour détecter le nombre de chiffres à reconnaitre sur les images (voir selection_region.png).
1.d. Possibilité de sélectionner avec la souris les régions où se trouvent les chiffres, ce qui permet une traitement rapide des images(voir selection_region.png).
1.e. Une fois la configuration faite, on peut lancer le traitement.
2. Correction des erreurs (fausses reconnaissances) : comme le taux de reconnaissance n'est pas à 100%, il y a une possibilité de parcourir les images(avec chiffres reconnus dessus) et un champs pour pouvoir corriger s'il y a une erreur. (resultat_correction.png).
3. Génération du fichier CSV(resultat_correction.png).
Partie Reconnaissance :
En ce qui concerne cette partie, je me suis basé sur la distance de Hausdorff pour comparer les chiffres que je crée moi même à ceux de l'image, et ce en m'inspirant des articles suivants (que mon entreprise avait obtenus):
article 1
article 2
article 3
article 4.
Je suis à la phase finale du projet (dernières retouches), et je compte le livrer bientôt.
Je serais ravi d'avoir des avis sur ce logiciel, principalement sur son interface utilisateur, qui est la partie la plus aboutie du projet, mais aussi sur les concepts implémentés, et éventuellement sur la méthode de reconnaissance que j'ai utilisé. S'il y en a , j'attends des remarques principalement de la part de ceux qui ont déjà réalisé un OCR.
Merci.
![]()








Répondre avec citation
Partager