Bonjour
Je n'arrive pas à utiliser la DLL tesseract pour récupérer du texte sur une image version .net 2 et .net 3.5 avec VS2005, VS2010, VS2012 sous XP,7 et 8.
J'ai utilisé les 3 versions tesseract (tesseract2, tesseract3 et tesseractdotnet)
- tesseract2 l'initialisation tesseract2.Init(tessdata, language, oem); quitte le programme sans erreur
- tesseractdotnet "Impossible de charger le fichier ou l'assembly 'tesseractengine3, Version=0.0.0.0, Culture=neutral, PublicKeyToken=null' ou une de ses dépendances. Cette application n'a pas pu démarrer car la configuration de l'application est incorrecte. Réinstaller l'application pourrait résoudre ce problème. (Exception de HRESULT : 0x800736B1)"
- tesseract3 quand j'utilise tesseract3.Recognize(bmp); j'ai "Tentative de lecture ou d'écriture de mémoire protégée. Cela indique souvent qu'une autre mémoire est endommagée."
- tesseract3 quand j'utilise tesseract3.AnalyseLayout(bmp); J'ai bien mes phrase mais tout les chars sont des 0
D'avance MERCI
0 000000000000 0 00 0000
0 000 000 00000000 0 0 000000000000 000
00000 00000000 00 0000 0 0000000 000000 00000 00000 0000000000000 0 00000 00000000 000000
0 00000000 0 000000000000
0000 0 0 00000000 00000000
000000 000 00000000000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| TesseractProcessor Tesseract3 = new TesseractProcessor();
Bitmap bmp = Bitmap.FromFile(@"test.png") as Bitmap;
string tessdata = @"tessdata";
string language = "fra";
int oem = 3;
Tesseract3.Init(tessdata, language, oem);
foreach (Block block in Tesseract3.AnalyseLayout(bmp).Blocks)
{
foreach (Paragraph paragraph in block.Paragraphs)
{
foreach (TextLine line in paragraph.Lines)
{
foreach (Word word in line.Words)
{
foreach (Character cha in word.CharList)
{
richTextBox1.Text += cha.Value;
}
richTextBox1.Text += " ";
}
richTextBox1.Text += "\n\r";
}
}
} |
Partager