Tesseract-ocr 3.0.2源码 + VS2010项目工程 + 简单测试代码

最新推荐文章于 2015-01-14 09:39:58 发布

原创最新推荐文章于 2015-01-14 09:39:58 发布 · 2.5w 阅读

10 ·

CC 4.0 BY-SA版权

C/C++ 同时被 3 个专栏收录

80 篇文章

订阅专栏

图像处理

10 篇文章

订阅专栏

资源共享

8 篇文章

订阅专栏

本文介绍了一个使用Tesseract OCR 3.0.2进行图像文本识别的例子，包括了初始化Tesseract API、设置语言及字符白名单、读取图像文件并获取识别结果等步骤。文中还提供了具体使用的第三方库版本，如zlib 1.2.7、leptonica 1.69等。

编译环境:Visual Studio 2010

所用类库版本:

zlib 1.2.7

lpng1514
jpegsr9
tiff-4.0.3
giflib-5.0.4
leptonica-1.69
tesseract-ocr3.0.2

下载地址http://pan.baidu.com/s/1c0pqvQg 密码rlib

测试代码

bool XYImage::RecognizeImage(const String &language /* = _T("eng") */,
							 const String &whitelist /* = _T("0123456789") */)
{
	tesseract::TessBaseAPI api;
	if (api.Init(GlobalizeString(AppBase::GetStartupPath()).toGBK(), GlobalizeString(language).toGBK(),
		tesseract::OEM_DEFAULT) == -1)
	{
		assert(!"ocr init failed!");
		return false;
	}

	api.SetVariable("classify_bln_numeric_mode", "1");
	api.SetVariable("tessedit_char_whitelist", GlobalizeString(whitelist).toGBK());

	auto pix = pixRead("F:\\1.bmp"); //把pixReadBmpStream函数从库里抄出来的, 可以实现加载内存图像
	if (pix != nullptr)
	{
		api.SetImage(pix);		

		char *pUTF8 = api.GetUTF8Text();//UTF-8编码

		if (pUTF8 != nullptr)
		{
			this->UTF8Text.Copy(pUTF8);
			delete[] pUTF8;
		}

		pixDestroy(&pix);

		return true;
	} //if

	return false;
}