使用EmguCV集成的Tesseract-OCR进行光学字符识别

本文介绍了如何利用开源的Tesseract-OCR进行光学字符识别,该算法由谷歌维护,集成在EmguCV中,适用于C#开发者。文章提供资源下载链接,并展示了调用核心代码,探讨了其在英文字符识别上的优秀表现,同时提到Tesseract-OCR也支持中文识别,但效果未验证。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

开源代码:https://github.com/tesseract-ocr/tesseract

简述:之前是惠普开发的,并在2005年开源出来,2006年,谷歌接手维护。在光学字符识别上算是一个不错的算法,而且还是开源的。开源项目中有详细的使用说明书供大家参考,可以仔细查阅,说不定有意外的的收获呢。另外,EmguCV集成了该算法,这对使用C#语言的人来说是一种福音,资源文件需要去官网下载,下载速度挺慢的,有需要可在下方链接进行下载:
https://download.youkuaiyun.com/download/IT_BOY__/12009964

调用的核心代码:

using Emgu.CV;
using Emgu.CV.OCR;
using Emgu.CV.Structure;
using Emgu.CV.CvEnum;
using System.Xml;

/// <summary>
/// 返回识别结果的置信度
/// </summary>
/// <param name="fileImagePath">图片路径</param>
public static void GetConfidence(string fileImagePath)
{
    XmlDocument doc = new XmlDocument();//新建对象
    //Tessdata 为资源路径
    _ocr = new Tesseract(@"Tessdata", "eng", OcrEngineMode.TesseractOnly);
    _ocr.SetVariable("tessedit_char_whitelist", "qwertyuioplkjhgfdaazxcvb0123456789");
    DirectoryInfo
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值