Bonjour,
Je veux extraire les chiffres d'une image via le module tesseract j'essaie avec le code suivant, mais les résultats ne sont pas probants :
résultat code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 import pytesseract from PIL import Image, ImageEnhance, ImageFilter pytesseract.pytesseract.tesseract_cmd = 'Lib/site-packages/pytesseract/tesseract/tesseract' im = Image.open("jul.png") # Ouverture du fichier image # Filtrage (augmentation du contraste) im = im.convert('RGB') im = im.filter(ImageFilter.MedianFilter()) enhancer = ImageEnhance.Contrast(im) im = enhancer.enhance(2) im = im.convert('1') # Lancement de la procédure de reconnaissance text = pytesseract.image_to_data(im) print(text)
level page_num block_num par_num line_num word_num left top width height conf text 1 1 0 0 0 0 0 0 117 128 -1 2 1 1 0 0 0 9 23 96 69 -1 3 1 1 1 0 0 9 23 96 69 -1 4 1 1 1 1 0 9 23 90 9 -1 5 1 1 1 1 1 9 23 18 8 51 wn
exemple image :
Avez-vous une solution ou une piste
merci d'avance
Partager