PaddleOCR 3.1 技术文档
1. 安装指南
1.1 环境要求
- Python 3.8~3.12
- 操作系统: Linux/Windows/macOS
- 硬件支持: CPU/GPU/XPU/NPU
1.2 安装方式
通过pip安装
pip install paddleocr
通过源码安装
git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
pip install -r requirements.txt
python setup.py install
2. 项目使用说明
2.1 快速开始
from paddleocr import PaddleOCR
# 初始化OCR模型
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
# 执行OCR识别
result = ocr.ocr("test.jpg", cls=True)
# 打印识别结果
for line in result:
print(line)
2.2 核心功能
- PP-OCRv5: 通用场景文本识别,支持5种文本类型
- PP-StructureV3: 复杂文档解析,输出结构化Markdown/JSON
- PP-ChatOCRv4: 智能信息提取,集成ERNIE 4.5模型
3. 项目API使用文档
3.1 主要API接口
初始化OCR引擎
PaddleOCR(
det_model_dir=None, # 检测模型路径
rec_model_dir=None, # 识别模型路径
cls_model_dir=None, # 方向分类模型路径
use_angle_cls=False, # 是否使用方向分类
lang="ch", # 语言类型
...
)
执行OCR识别
ocr.ocr(
img_path, # 图片路径或numpy数组
det=True, # 是否执行文本检测
rec=True, # 是否执行文本识别
cls=False, # 是否执行方向分类
...
)
3.2 输出格式
[
{
"text": "识别文本",
"confidence": 0.99,
"text_box_position": [[x1,y1],[x2,y2],[x3,y3],[x4,y4]]
}
]
4. 项目安装方式
4.1 完整安装
# 安装PaddlePaddle基础框架
pip install paddlepaddle
# 安装PaddleOCR完整包
pip install paddleocr[all]
4.2 轻量级安装
# 仅安装核心功能
pip install paddleocr
4.3 自定义安装
# 安装特定功能模块
pip install paddleocr[structure] # 仅安装文档结构分析功能
pip install paddleocr[gpu] # 安装GPU版本
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



