linux安装tesseract支持tess4j图片识别

安装依赖

yum install -y autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel gcc gcc-c++

安装tesseract

统一安装在/usr/local/

安装leptonica

mkdir /usr/local/leptonica
cd /usr/local/leptonica
#上传leptonica-1.79.0.tar.gz到/usr/local/leptonica目录下
tar -xzvf leptonica-1.79.0.tar.gz
cd leptonica-1.79.0
./configure --prefix=/usr/local/leptonica  && make  && make install

配置leptonica环境变量

vim /etc/profile

#在文件末尾追加配置
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR

#应用配置
source /etc/profile

安装tesseract

mkdir /usr/local/tesseract
cd /usr/local/tesseract
#上传tesseract-4.1.1.tar.gz到/usr/local/tesseract目录下
tar -xzvf tesseract-4.1.1.tar.gz
cd tesseract-4.1.1
# 必须先运行autogen.sh文件才会有configuer文件
./autogen.sh
# 编译安装到指定文件夹
./configure --prefix=/usr/local/tesseract  && make && make install

下载识别库

所有的识别库地址:https://github.com/tesseract-ocr/tessdata
我们只需要中文识别库,所以下面通过中文识别库举例。中文识别库已经下载后,只需要上传到指定目录即可。
点击下载中文简体语言库chi_sim.traineddata,上传到 /usr/local/tesseract/share/tessdata/目录。
若是java项目中已经使用了识别库,不需要再下载,只需要下一步配置时配置到java中使用的目录地址即可。

配置tesserac环境变量

vim /etc/profile

## 注:TESSDATA_PREFIX后面的地址是训练库所在的文件目录
## 建议识别库放置地址为 /usr/local/tesseract/share/tessdata,注意同步修改下方TESSDATA_PREFIX的值
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/tesseract/share/tessdata  
##注意:该位置是训练库所在文件目录
export PATH=$PATH:$TESSDATA_PREFIX 

# 应用配置
source /etc/profile

测试安装是否成功

tesseract --version

测试识别功能

tesseract   /home/测试.png  /home/结果  -l chi_sim

查看测试结果

cat /home/结果.txt

tesseract4.1 training训练工具的编译安装

安装依赖

yum install libicu-devel pango-devel cairo-devel

安装libarchive

libarchive包下载地址

mkdir /usr/local/libarchive
cd /usr/local/libarchive
#上传libarchive-3.3.3.tar.gz到/usr/local/libarchive目录下
tar -zxvf libarchive-3.3.3.tar.gz 
cd libarchive-3.3.3
#编译并安装
./configure
cmake .
make
make install

安装icu52版本

icu52包下载地址

mkdir /usr/local/icu4c-52
cd /usr/local/icu4c-52
#上传icu4c-52_2-src.tgz到/usr/local/icu4c-52目录下
tar -zxvf icu4c-52_2-src.tgz
/usr/local/icu4c-52/icu-release-52-1/icu4c/source
#cd icu/source/
编译并安装
./runConfigureICU Linux --with-library-bits=64
make -j 5
make install

创建软连接

ln -s /usr/local/lib/libicui18n.so.52 /usr/lib64/libicui18n.so.52
ln -s /usr/local/lib/libicuio.so.52 /usr/lib64/libicuio.so.52
ln -s /usr/local/lib/libicuuc.so.52 /usr/lib64/libicuuc.so.52
ln -s /usr/local/lib/libicudata.so.52 /usr/lib64/libicudata.so.5

执行./configure并观察输出日志

## 查看执行下面命令输出日志的条件是否为yes,否则检查前面的安装步骤,继续安装该项软件包。
## 注意:/usr/local/icu4c-52/lib/pkgconfig为安装的icu的pkconfig路径
## /usr/local/libarchive/libarchive-3.3.3/build/pkgconfig为安装的libarchive的pkconfig路径
## /usr/local/leptonica/lib/pkgconfig为安装的leptonica的pkconfig路径
cd /usr/local/tesseract/tesseract-4.1.1
./configure PKG_CONFIG_PATH=/usr/local/icu4c-52/lib/pkgconfig:/usr/local/libarchive/libarchive-3.3.3/build/pkgconfig:/usr/local/leptonica/lib/pkgconfig

反复执行./configure命令,直至出现如下的输出为止,否则就是还缺少依赖包,需要检查前边的安装步骤:

 如果一直出现以下日志那就是缺少依赖,检查上边的输出日志缺少啥依赖:

安装训练工具

make training
make training-install

 安装完之后就可以进行模型训练了。

以上需要到的包也可百度网盘自取:

链接: https://pan.baidu.com/s/1OoSi23ES1zmWlYMIKeq3MQ

提取码: vqcu

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值