Bonjour
Je n'arrive pas à utiliser la DLL tesseract pour récupérer du texte sur une image version .net 2 et .net 3.5 avec VS2005, VS2010, VS2012 sous XP,7 et 8.
J'ai utilisé les 3 versions tesseract (tesseract2, tesseract3 et tesseractdotnet)
- tesseract2 l'initialisation tesseract2.Init(tessdata, language, oem); quitte le programme sans erreur
- tesseractdotnet "Impossible de charger le fichier ou l'assembly 'tesseractengine3, Version=0.0.0.0, Culture=neutral, PublicKeyToken=null' ou une de ses dépendances. Cette application n'a pas pu démarrer car la configuration de l'application est incorrecte. Réinstaller l'application pourrait résoudre ce problème. (Exception de HRESULT : 0x800736B1)"
- tesseract3 quand j'utilise tesseract3.Recognize(bmp); j'ai "Tentative de lecture ou d'écriture de mémoire protégée. Cela indique souvent qu'une autre mémoire est endommagée."
- tesseract3 quand j'utilise tesseract3.AnalyseLayout(bmp); J'ai bien mes phrase mais tout les chars sont des 0
D'avance MERCI
0 000000000000 0 00 0000
0 000 000 00000000 0 0 000000000000 000
00000 00000000 00 0000 0 0000000 000000 00000 00000 0000000000000 0 00000 00000000 000000
0 00000000 0 000000000000
0000 0 0 00000000 00000000
000000 000 00000000000
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
TesseractProcessor Tesseract3 = new TesseractProcessor();
Bitmap bmp = Bitmap.FromFile(@"test.png") as Bitmap;
string tessdata = @"tessdata";
string language = "fra";
int oem = 3;
 
Tesseract3.Init(tessdata, language, oem);
 
foreach (Block block in Tesseract3.AnalyseLayout(bmp).Blocks)
{
	foreach (Paragraph paragraph in block.Paragraphs)
	{
		foreach (TextLine line in paragraph.Lines)
		{
			foreach (Word word in line.Words)
			{
				foreach (Character cha in word.CharList)
				{
					richTextBox1.Text += cha.Value;
				}
				richTextBox1.Text += " ";
			}
			richTextBox1.Text += "\n\r";
		}
	}
}