paddleocr私有部署-优快云博客

部署paddleocr v5 环境要求 ubuntu 22.04 / python 3.11 / paddlepaddle 3.1.0

ubuntu基础环境配置可参考：ubantu环境初始化_ubantu 初始化ip-优快云博客

python基础环境配置可参考：ubuntu22.04 python升级并安装pip命令-优快云博客

基础环境安装完成后，若是最小化安装的ubuntu需要提前安装libGL.so.1,否则后面运行paddleocr命令会报错

ImportError: libGL.so.1: cannot open shared object file: No such file or directory

安装libGL.so.1

apt -y install libgl1-mesa-glx

接下来即可先安装飞桨框架，部署paddleocr必须提前安装该框架

参考飞桨官网选择适合自己环境的命令:开始使用_飞桨-源于产业实践的开源深度学习平台

python3 -m pip install paddlepaddle==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

安装第三方库可能会出现以下连接超时的情况

pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out

可以在安装第三方库命令中增加参数--default-timeout=100

python3 -m pip install --default-timeout=100 paddlepaddle==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

等待安装完成后部署paddleocr

安装推理包

python3 -m pip install paddleocr

安装训练依赖

cd /opt

拉取github源码
git clone https://github.com/PaddlePaddle/PaddleOCR

若是没有git命令则执行以下命令安装
apt -y install git

cd PaddleOCR

切换到最新版本分支
git checkout release/3.1

安装依赖
python3 -m pip install -r requirements.txt

----------------------------------------------------------------

若是服务器从github拉取源码很慢可以直接使用浏览器到github上下载源码压缩包

下载完成后放到opt目录下解压

解压完成后进入到解压目录执行安装依赖命令即可
python3 -m pip install -r requirements.txt

至此paddleocr已部署完成，执行以下命令看是否安装成功

paddleocr --help
paddlex --help

下载官方的paddleocr推理模型，一般就下载文本检测模块和文本识别模块的模型即可

下载完成后放到paddleocr的源码目录下，然后直接直接解压命令即可

 cd /opt/PaddleOCR-release-3.1/
tar xvf PP-OCRv5_server_rec_infer.tar
tar xvf PP-OCRv5_server_det_infer.tar

上传一张图片到服务器中，执行以下命令即可使用paddleocr服务

#以下命令中对于不使用的模块用False禁止,对于使用的模块指定模块的目录
paddleocr ocr -i ./4.jpg --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False --text_detection_model_dir /opt/PaddleOCR-release-3.1/PP-OCRv5_server_det/ --text_recognition_model_dir /opt/PaddleOCR-release-3.1/PP-OCRv5_server_rec/