Tesseract-OCR(开源光学字符识别引擎)

最新推荐文章于 2024-11-26 17:13:48 发布

原创最新推荐文章于 2024-11-26 17:13:48 发布 · 10w+ 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#引擎 #image #processing #library #.net

.NET 同时被 2 个专栏收录

25 篇文章

订阅专栏

图像处理

10 篇文章

订阅专栏

Tesseract-OCR引擎在1995年的UNLV Accuracy测试中表现出色，尽管2006年前发展缓慢，但仍是准确度较高的开源OCR引擎之一。它能处理二值、灰度和彩色图像，依赖于Leptonica库进行图像输入。TesseractDotnet是针对.NET开发者的一个项目，简化了在.NET环境中使用Tesseract-OCR的过程。对于C++开发人员，尚缺乏可用的类库。了解更多详情，请访问相关项目主页。

Tesseract-OCR Background

The Tesseract OCR engine was one of the top 3 engines in the 1995 UNLV Accuracy test. Between 1995 and 2006 it had little work done on it, but it is probably one of the most accurate open source OCR engines available. The source code will read a binary, grey or color image and output text. Image input is managed by the Leptonica Image Processing Library which can read a wide variety of image formats.

更多详情请访问项目主页: http://code.google.com/p/tesseract-ocr/

TesseractDotnet

TesseractDot 是Tesseract-OCR的.NET项目, 方便.NET开发人员使用Tesseract-OCR.但是我还没发现C++可用的类库，源码也无法编译成dll.

更多详情请访问项目主页: http://code.google.com/p/tesseractdotnet/

另外推荐一些文章:

使用Tesseract OCR 提取复杂图像中的文字

tesseract 训练

TrainingTesseract3

2 条评论

测试一下 2014.04.06
正想学习下这方面的前面看看

RLib 2013.07.25
Tesseract-ocr 3.0.2 最新源码 + VS2010项目工程 http://blog.youkuaiyun.com/rrrfff/article/details/8552946

achenglike 2013.04.24
xzx

2012.07.26
【博客文章导出通知】您的文章 ' Tesseract-OCR(开源光学字符识别引擎)' 已被成功导出! http://www.oschina.net/code/snippet_551551_10332

RLib 2012.01.18
用imagemagick和tesseract-ocr破解简单验证码 http://www.iteye.com/topic/993538

RLib 2012.01.18
ImageMagick (TM) 是一个免费的创建、编辑、合成图片的软件。它可以读取、转换、写入多种格式的图片。图片切割、颜色替换、各种效果的应用，图片的旋转、组合，文本，直线，多边形，椭圆，曲线，附加到图片伸展旋转。ImageMagick是免费软件：全部源码开放，可以自由使用，复制，修改，发布。它遵守GPL许可协议。它可以运行于大多数的操作系统。ImageMagick的大多数功能的使用都来源于命令行工具。通常来说，它可以支持以下程序语言： Perl, C, C++, Python, PHP, Ruby, Java；现成的ImageMagick接口(PerlMagick, Magick++, PythonMagick, MagickWand for PHP, RubyMagick, and JMagick)是可利用的。 http://www.imagemagick.com.cn/ http://www.imagemagick.org/script/index.php