Centos 6 tesseract安装

本文详细介绍了在CentOS环境中安装Tesseract OCR的过程,包括安装依赖库Leptonica,配置Automake和Libtool,以及下载和编译Tesseract源码。此外,还提供了安装中英文识别库的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在进行Python数据爬虫方向的研究,使用到了与图像识别相关的一些功能,这样就会使用到图像识别的重要工具Tesseract。下面就在CentOS环境下安装和配置Tesseract的工作环境进行讲解。查阅了网上很多资料,现将自己的安装和测试过程记录如下:

  1. 安装依赖库leptioncal库

 1.1 进入供存放下载文件库的目录:执行wget http://www.leptonica.com/source/leptonica-1.72.tar.gz ,出现如下图所示软件下载界面:

 

 后顺序执行下面四个指令: 

 1.2 执行解压指令  tar -xvf leptonica-1.72.tar.gz;

 1.3 进入leptonica-1.72目录,执行配置指令 ./configure

 1.4 执行编译指令 make

 1.5 执行安装指令 make install

 至此,leptonica安装完毕

  1. 安装Tesseract编译要用的automake和libtool

2.1 yum install automake

2.2 yum install libtool

  1. 安装tesseract

3.1 下载Tesseract 3.04版本

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

3.2 下载完成后,修改下安装包的名字以作区分

mv 3.04.00.tar.gz  Tesseract3.04.tar.gz

3.3 参考上面的leptonica安装步骤,首先解压Tesseract3.04.tar.gz  tar -xvf Tesseract3.04.tar.gz

3.4 进入解压后的目录:tesseract-3.04.00  cd tesseract-3.04.00,进入目录后发现目录下有一个autogen.sh,执行之,结果如下图:

3.5 执行配置指令 ./configure

在执行过程中,出现错误:

表明缺少了缺少c++编译器,执行下面命令安装:

yum install gcc-c++

然后再次执行./configure命令,成功。

3.6 执行编译指令 make

3.7 执行安装指令 make install

4 下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata


作者:perfecttshoot
来源:优快云
原文:https://blog.youkuaiyun.com/wanght89/article/details/78329546
版权声明:本文为博主原创文章,转载请附上博文链接!

按照上文在Centos中安装tesseract中,至tesseract的make时又出现make error的问题,执行运行 autoreconf -ivf 解决。
关于最后的中英文识别库,安装好后将其复制一份到/usr/local/share/(此处不全,具体看报错信息)就OK啦

转载于:https://www.cnblogs.com/greystone/p/10781010.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值