OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。
一、简介
Tesseract-OCR依赖图像库Leptonica。 Leptonica是一个开源的图像处理和图像分析库。它主要包括的操作有:位图操作、仿射变换、形态学操作、连通区域填充、图像变换及像素掩模、融合、增强、算术运算等操作。
在使用Leptonica的时候,它依赖于开源的zlib、libjpeg、libpng、libtiff、giflib。
(1)zlib是一个很好的压缩、解压缩库。它的license是zlib授权,类似BSD。
(2)libjpeg是一个完全用C语言编写的库,包含了被广泛使用的JPEG解码、JPEG编码和其它的JPEG功能的实现。它的license类似BSD。
(3)libpng是官方的PNG参考库,它支持几乎所有的PNG功能,它也是可扩展的。它使用zlib库作为压缩引擎。它的license是permissive free software license,类似BSD。
(4)libtiff是一个用来读写TIFF文件的开源库,它依赖于libjpeg和zlib。它的license是BSD。
(5)giflib是一个读、写GIF图像的开源库,它的license类似BSD。
二、编译环境搭建
1、系统平台:windows10 - VS2013
2、Leptonica编译,可以直接从以下路径下载对应的VS版本:
https://github.com/charlesw/tesseract-vs2012
https://github.com/tesseract4java/tesseract-vs2013
&