Emgu.CV.OCR Namespace中。
光学字符识别。包装tesseract-ocr引擎。
Tesseract 类。
构造函数:
public Tesseract() //创建一个默认的tesseract引擎。需要调用Init函数来在以后的阶段加载语言文件。
public Tesseract(
string dataPath, //datapath必须是tessdata主目录的名称,必须以/。结束。最后一个/将被剥离。
string language,//语言是(通常)一个ISO 639-3字符串或NULL将默认为eng。它是完全安全的(并且最终也会是有效的)在同一个实例上调用Init多次来改变语言,或者只是重新设置分类器。该语言可能是一串形式的%lt;lang+lang,表示将加载多种语言。

这篇博客介绍了如何利用Emgu.CV.OCR中的Tesseract类进行光学字符识别(OCR),包括构造函数、基本属性以及Tesseract.Character结构体的详细解释。在应用中,通过设置识别库路径、选择识别语言,然后加载图像到OCR对象并进行识别,最终展示识别结果和高亮显示文字区域。
最低0.47元/天 解锁文章
551

被折叠的 条评论
为什么被折叠?



