1 pièce(s) jointe(s)
récupération chiffre image (tesseract)
Bonjour,
Je veux extraire les chiffres d'une image via le module tesseract j'essaie avec le code suivant, mais les résultats ne sont pas probants :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
pytesseract.pytesseract.tesseract_cmd = 'Lib/site-packages/pytesseract/tesseract/tesseract'
im = Image.open("jul.png") # Ouverture du fichier image
# Filtrage (augmentation du contraste)
im = im.convert('RGB')
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
# Lancement de la procédure de reconnaissance
text = pytesseract.image_to_data(im)
print(text) |
résultat code :
level |
page_num |
block_num |
par_num |
line_num |
word_num |
left |
top |
width |
height |
conf |
text |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
117 |
128 |
-1 |
|
2 |
1 |
1 |
0 |
0 |
0 |
9 |
23 |
96 |
69 |
-1 |
|
3 |
1 |
1 |
1 |
0 |
0 |
9 |
23 |
96 |
69 |
-1 |
|
4 |
1 |
1 |
1 |
1 |
0 |
9 |
23 |
90 |
9 |
-1 |
|
5 |
1 |
1 |
1 |
1 |
1 |
9 |
23 |
18 |
8 |
51 |
wn |
exemple image :
Pièce jointe 617524
Avez-vous une solution ou une piste
merci d'avance