要从图片中识别字符,可以使用tesseract库。
如果使用Python,可以直接使用
pip install tesseract
安装之后,就可以在Python中
import tesseract
来使用了。
如果我们在C++的开发中,要使用tesseract,其实也非常简单。
tesseract在Linux各发行版,都有现成的二进制安装包,而且还同时提供了C语言、C++的支持。本文中的示例,采用C++的接口。
开发环境
如果是Fedora系统,可以直接通过
dnf install tesseract-devel
来安装tesseract的开发库。
之后,可以直接在程序中链接-ltesseract,包含的头文件目录除了/usr/include/tesseract之外,还需要/usr/include/leptonica、/usr/include/libpng16等。
为了简化这一操作,可以使用pkg-config文件。
如:
~/$ pkg-config --cflags --libs tesseract
-I/usr/include/leptonica -I/usr/include/libpng16 -DWITH_GZFILEOP -I/usr/include/webp -ltesseract
头文件以及API
安装好tesseract,在构建系统中设置包含目录之后,就可以在程序中包含相应的头文件了。
如果是在C语言中,需要包含
#include <tesseract/capi.h>
,而如果是在C++中,可以使用C语言的API,也可以使用C++的Class API,需要包含:<