Tesseract 识别率有点低,使用nuget直接加载 Tesseract,简单几行代码就可以识别图片中的文字
using (TesseractEngine engine = new TesseractEngine("C:\\tessdata_chi_sim-master\\best", "chi_sim", EngineMode.Default))
{
using (var img = Pix.LoadFromFile("c:\\1.jpg"))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
return text;
}
}
}
如果需要提高识别率也可以自己训练字库
本文介绍了如何使用NuGet包快速集成TesseractOCR引擎进行图片文字识别,提到了识别率较低时的处理方法以及如何通过训练字库来提高识别准确性。
2082

被折叠的 条评论
为什么被折叠?



