Linux上安装部署Tesseract

本文详细描述了如何在Linux系统上安装TesseractOCR引擎,包括GCC、相关依赖工具的安装,Leptonica的编译与环境设置,以及Tesseract本身的编译和配置,特别提到了Java测试时可能出现的问题和解决方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、安装Tesseract引擎
安装gcc、gcc-c++、make,如果有就不需要理会了

yum install gcc gcc-c++ make
1
安装编译相关工具,没有的话编译时候可能报错

yum install autoconf automake libtool
1
安装对图片识别相关支持工具

yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
1
安装leptonica

前往官网下载压缩包后上传至linux后解压,下载链接:http://www.leptonica.org/download.html

#解压,注意这个leptionca的版本与tesseract的版本是否匹配
tar -zxvf leptonica-1.xx.x.tar.gz
#进入文件夹
cd leptonica-1.xx.x
# 依次执行以下命令,进行程序编译,安装
./autogen.sh
./configure
make
make install
1
2
3
4
5
6
7
8
9
把leptonica添加到环境变量里头

# 修改profile
vim /etc/profile
# 添加信息 i 
export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
# 保存 Esc =》:wq! 
# 刷新配置
source /etc/profile
1
2
3
4
5
6
7
8
9
安装Tesseract-OCR

下载压缩包后上传至linux后解压,下载链接:https://github.com/tesseract-ocr/tesseract/releases

#解压
tar -xzvf tesseract-x.x.x.tar.gz
cd tesseract-x.x.x
./autogen.sh 
./configure
make
make install
1
2
3
4
5
6
7
添加到环境变量

vim /etc/profile
# 添加以下字段:
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/root/tessdata    #这个路径自己选择,tessdata要去下载
export PATH=$PATH:$TESSDATA_PREFIX
# 刷新配置
source /etc/profile    
1
2
3
4
5
6
7
8
下载tessdata语言包

下载链接:https://gitcode.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

下载完自己去选个地方放,需要什么语言的下什么语言。

查看

# 查看tesseract版本
tesseract --version
1
2
如果出现下面的


说明安装成功。

2、使用Java测试的时候,报错
java.lang.NoClassDefFoundError: Could not initialize class net.sourceforge.tess4j.TessAPI
1
1、确定maven引入的tess4或这tess4j的版本是否与服务器上的版本一致。参考链接?http://tess4j.sf.net/docs/

2、有没有把so动态链接库确认复制好(关键),没有就去复制吧。ps:可能这些so链接并不是在/usr/local/lib里头,看你构建(make)Tesseract-OCR和leptonica是怎么丢在那的吧。

cp /usr/local/lib/*.so.* /usr/lib64/
1
3、最后,一般都不用重启服务器,如果不行,可以重启下服务器试试

到这里,就可以用了。至于其他的问题。像什么没有linux-x86-64/libtesseract.so之类的。要么是Tesseract-OCR没装好,就是链接找不到的。

### 如何在Linux安装配置 Tesseract-OCR #### 使用 YUM 安装 Tesseract-OCR 对于基于 Red Hat 的发行版,如 CentOS 和 Fedora,可以利用 `yum` 来简化安装过程。通过官方仓库可以直接获取并安装 Tesseract OCR 及其开发文件。 ```bash sudo yum install -y tesseract tesseract-devel ``` 这行命令将会自动处理所有的依赖关系,并默认安装最新的稳定版本 5.3.0 版本[^1]。 #### 手动编译安装方法 如果希望自定义安装或需要特定版本,则可以选择手动下载源码进行编译: ##### 下载指定版本的 Tesseract 源码包 使用 `wget` 命令可以从 GitHub 上拉取所需版本的压缩包,例如4.0.0版本: ```bash wget https://github.com/tesseract-ocr/tesseract/archive/4.0.0.tar.gz tar zxvf 4.0.0.tar.gz cd tesseract-4.0.0/ ``` 同时还需要单独下载 Leptonica 库作为图像处理支持组件[^2]。 ##### 编译前准备 确保已经安装了必要的构建工具链以及运行环境。特别是当遇到 GCC 版本过低的情况时,建议更新到更高版本来避免潜在错误。可以通过以下方式安装较新的GCC版本: ```bash sudo yum install -y centos-release-scl sudo yum install devtoolset-8-gcc* scl enable devtoolset-8 bash ``` 上述操作会临时切换当前 shell session 中使用的 GCC 至新版,而不会影响系统的默认设置[^5]。 完成以上准备工作之后就可以继续按照常规流程执行 configure、make 和 make install 步骤来进行本地化部署了。 #### Python 绑定 Pytesseract安装 为了能够在Python程序里调用 Tesseract 进行文字识别工作,还需额外安装 python-tesseract 接口库: ```bash pip3 install pytesseract ``` 这样便可以在编写脚本的时候轻松集成光学字符识别功能[^3]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值