参考官网:使用教程 - PaddleOCR 文档
部署paddleocr v5 环境要求 ubuntu 22.04 / python 3.11 / paddlepaddle 3.1.0
ubuntu基础环境配置可参考:ubantu环境初始化_ubantu 初始化ip-优快云博客
python基础环境配置可参考:ubuntu22.04 python升级并安装pip命令-优快云博客
基础环境安装完成后,若是最小化安装的ubuntu需要提前安装libGL.so.1,否则后面运行paddleocr命令会报错
ImportError: libGL.so.1: cannot open shared object file: No such file or directory
安装libGL.so.1
apt -y install libgl1-mesa-glx
接下来即可先安装飞桨框架,部署paddleocr必须提前安装该框架
参考飞桨官网选择适合自己环境的命令:开始使用_飞桨-源于产业实践的开源深度学习平台
python3 -m pip install paddlepaddle==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
安装第三方库可能会出现以下连接超时的情况
pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out
可以在安装第三方库命令中增加参数--default-timeout=100
python3 -m pip install --default-timeout=100 paddlepaddle==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
等待安装完成后部署paddleocr
安装推理包
python3 -m pip install paddleocr
安装训练依赖
cd /opt
拉取github源码
git clone https://github.com/PaddlePaddle/PaddleOCR
若是没有git命令则执行以下命令安装
apt -y install git
cd PaddleOCR
切换到最新版本分支
git checkout release/3.1
安装依赖
python3 -m pip install -r requirements.txt
----------------------------------------------------------------
若是服务器从github拉取源码很慢可以直接使用浏览器到github上下载源码压缩包
下载完成后放到opt目录下解压
解压完成后进入到解压目录执行安装依赖命令即可
python3 -m pip install -r requirements.txt
至此paddleocr已部署完成,执行以下命令看是否安装成功
paddleocr --help
paddlex --help
下载官方的paddleocr推理模型,一般就下载文本检测模块和文本识别模块的模型即可
下载完成后放到paddleocr的源码目录下,然后直接直接解压命令即可
cd /opt/PaddleOCR-release-3.1/
tar xvf PP-OCRv5_server_rec_infer.tar
tar xvf PP-OCRv5_server_det_infer.tar
上传一张图片到服务器中,执行以下命令即可使用paddleocr服务
#以下命令中对于不使用的模块用False禁止,对于使用的模块指定模块的目录
paddleocr ocr -i ./4.jpg --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False --text_detection_model_dir /opt/PaddleOCR-release-3.1/PP-OCRv5_server_det/ --text_recognition_model_dir /opt/PaddleOCR-release-3.1/PP-OCRv5_server_rec/