本文给大家分享C#版Tesseract库的使用技巧,在这里大家需要注意一下tesseract的识别语言包要自己下载后包含到项目里面,并设置为始终复制,或者直接把这个文件包放到运行程序目录(bin\debug)下的,具体实现代码跟随小编一起学习下吧
C#版本源码下载地址:https://github.com/charlesw/tesseract
其实在vs中可以直接用NuGet工具进行下载:
打开nuget,搜索tesseract,点安装即可。

关键代码:
//调用tesseract实现OCR识别
public string ImageToText(string imgPath)
{
using (var engine = new TesseractEngine("tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(imgPath))
{
using (var page = engine.Process(img))
{
return page.GetText

本文介绍了如何在C#项目中使用Tesseract OCR库进行图像识别,包括下载语言包、设置复制方式及针对不同语言的识别过程。还涉及了OpencvSharp的预处理步骤和中文识别的特别说明。
最低0.47元/天 解锁文章
1720

被折叠的 条评论
为什么被折叠?



