IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Traitement d'images Discussion :

Réalisation d'un OCR


Sujet :

Traitement d'images

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2021
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 24
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2021
    Messages : 3
    Points : 1
    Points
    1
    Par défaut Réalisation d'un OCR
    Je suis actuellement en stage au sein d'un cabinet de comptabilité et je dois réaliser l'automatisation de certains de leur processus.
    Une partie de ces processus se base sur L'OCR (Optical character recognition) pour la recherche de donnée dans une image scannée. Après l'utilisation de certaine librairie déjà existante tel que easyocr, pytesseract,opencv à l'aide de python, et l'utilisation d'extracteur de texte en ligne, je n'arrive pas à avoir de résultat concluant. C'est pourquoi je me suis penché sur la réalisation de mon propre OCR. Après de nombreuse recherche j'ai remarqué, que la majorité des projets se base sur les réseaux neuronaux ainsi que le modèle de Markov caché. Cependant peu de documentation concrète (non mathématique) pour l'élaboration d'un programme existe sur le domaine.
    C'est pourquoi je voulais savoir si vous seriez par quoi je devrais commencer, et si vous auriez des documentations sur des codes informatiques.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    341
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 341
    Points : 528
    Points
    528
    Par défaut
    Bonsoir,

    Sur Github, il y a ce projet simple développé dans le cadre d'un TIPE.

    Reconnaissance de codes postaux par ordinateur

    Ce projet est un programme de reconnaissance optique de caractères (OCR) développé dans le cadre du TIPE du deuxième année de CPGE. Il permet la reconnaissance d'un code postal à partir d'un scan manuscrit. L'objectif était de découvrir le fonctionnement d'un OCR et d'en développer un en partant de zéro. Ainsi les fonctions de bases telles que le seuillage, le calcul d'un histogramme ou la détection des contours ont été réimplémentées.

    https://github.com/guillaumebour/programme-ocr

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2021
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 24
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2021
    Messages : 3
    Points : 1
    Points
    1
    Par défaut
    Bonjour, merci pour votre réponse effectivement ce github est une véritable mine d'or, j'ai appris beaucoup de chose dessus.
    Désormais je voulais savoir, je suis nouveau dans le domaine et mon sujet se base sur la détection de caractère non manuscrite ce qui est un peu différent de ce projet donc je dois reconnaitre, la majeur partie des caractères ce trouvant dans une table ascii. Je voulais savoir si ce genre de dataset était disponible pour ce genre de chose avec des échantillons de toutes les lettres dans différentes police, ou si je devais le faire moi meme.

  4. #4
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2021
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 24
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2021
    Messages : 3
    Points : 1
    Points
    1
    Par défaut
    Après avoir utilisé les codes du github en insérant un dataset de police non manuscrite, le programme ne reconnait plus du tout les caractères même pour des images très net.
    Comment dois je y remédier?

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    267
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 267
    Points : 367
    Points
    367
    Par défaut Le format de l'image
    Normalement il faut passer le format de l'image en TIFF équivalent du point par point plus détaillé que le BMP .
    Il faut regarder sur source forge sur le le projet TESSERACT qui est un ocr par réseaux de neurones .

Discussions similaires

  1. Traitement d'images : réalisation d'un OCR
    Par likoudA dans le forum Mon programme
    Réponses: 0
    Dernier message: 13/08/2009, 13h00
  2. Les étapes à suivre pour la réalisation d'un OCR ?
    Par nonosa dans le forum Algorithmes et structures de données
    Réponses: 22
    Dernier message: 29/05/2007, 16h32
  3. msi ou comment réaliser un installeur?
    Par herzleid dans le forum Delphi
    Réponses: 11
    Dernier message: 09/04/2007, 19h27
  4. [Radio fréquence] réalisation d'une application
    Par WriteLN dans le forum Développement
    Réponses: 14
    Dernier message: 05/06/2003, 14h36
  5. [imprecis]Réaliser a^n avec seulement l'opérateur d'addition
    Par Amon dans le forum Algorithmes et structures de données
    Réponses: 18
    Dernier message: 08/11/2002, 22h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo