J'ai besoin de developper une "petite" application qui va prendre des screenshoots de l'ecran a intervalle regulier(toutes les minutes) , et qui ensuite va faire une reconnaissance de caractere sur l'image. pour obtenir le texte a l'ecran sous forme de String. Qu'ensuite je pourrais traiter facilement et stocker ces informations dans une base de données.
Je suis obligé d'utilisé la methode ocr , car je n'ai pas le droit d'interférer avec l'application et je n'ai aucun moyen d'acceder aux données.
Pour simplifier la tache , la photo prise de l'ecran sera tjrs la meme , seul le texte change . c'est a dire tjrs la meme couleur, meme disposition , meme police de caractere.
Mon probleme c'est que je ne sais pas du tout comment faire. Et je n'y connais absolument rien en reconnaissance de caractere.
Alors pour la photo de l'ecran. Je suppose que l'appli doit envoyer le code de la touche impr ecran pour que le syteme d'exploitation prenne une photo
au format bmp.Ensuite ...euh ensuite.... enregistrer la photo sur le disque dur. La charger dans mon application. Tranformer l'image en noir et blanc.
Le format bmp c'est 3 chiffres de 0 à 255 pour rouge vert bleu ? ya t'il une entête particuliere au format ? les chiffres sont stocker a la suite dans le fichier style : pixel 1: 0,0,20 pixel 2: 0,50,255 ect.... ?
Le code pour le noir je crois que c'est 0,0,0 donc si l'ecriture est en noir je regarde tout les pixels s'approchant de cette valeur , car ce n'est jamais 100% noir (enfin une couleur uni)? donc je prend par exemple une tolérance de maximum 10,10,10.
Avant j'aurai fait une decoupe dans l'image pour garder les pixels de la ligne a traduire. Style un rectangle de 30 pixels de haut sur 500 de large.
Aprés tout ca je regarde chaque caractere , je fais des mesures en nombre de pixels je suppose , écartement , si il forme un cercle ect.. (c'est tres vague dans mon esprit) et ca pour chaque lettre de l'alphabet , je compare ca a des références que j'aurais stocker au préalable(comment je les obtiens bonne question) , et la comparaison qui obtient le plus au taux de réussite correspond a cette reférence donc a tel lettre ? apres j'ai une suite de cactere et si j'ai pris en compte les espaces c'est tout simple.
Donc si quelqu'un aurait deja travaillé sur ce genre d'application , j'aurais grandement besoin de conseil car c'est quand même trés vague pour moi.
Toutes les infos sont bienvenue .
Partager