PaddleOCR 3.1 技术文档-优快云博客

PaddleOCR 3.1 技术文档

【免费下载链接】PaddleOCR 飞桨多语言OCR工具包（实用超轻量OCR系统，支持80+种语言识别，提供数据标注与合成工具，支持服务器、移动端、嵌入式及IoT设备端的训练与部署） Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices) 项目地址: https://gitcode.com/paddlepaddle/PaddleOCR

1. 安装指南

1.1 环境要求

Python 3.8~3.12
操作系统: Linux/Windows/macOS
硬件支持: CPU/GPU/XPU/NPU

1.2 安装方式

通过pip安装

pip install paddleocr

通过源码安装

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
pip install -r requirements.txt
python setup.py install

2. 项目使用说明

2.1 快速开始

from paddleocr import PaddleOCR

# 初始化OCR模型
ocr = PaddleOCR(use_angle_cls=True, lang="ch")

# 执行OCR识别
result = ocr.ocr("test.jpg", cls=True)

# 打印识别结果
for line in result:
    print(line)

2.2 核心功能

PP-OCRv5: 通用场景文本识别，支持5种文本类型
PP-StructureV3: 复杂文档解析，输出结构化Markdown/JSON
PP-ChatOCRv4: 智能信息提取，集成ERNIE 4.5模型

3. 项目API使用文档

3.1 主要API接口

初始化OCR引擎

PaddleOCR(
    det_model_dir=None,  # 检测模型路径
    rec_model_dir=None,  # 识别模型路径
    cls_model_dir=None,  # 方向分类模型路径
    use_angle_cls=False, # 是否使用方向分类
    lang="ch",           # 语言类型
    ...
)

执行OCR识别

ocr.ocr(
    img_path,           # 图片路径或numpy数组
    det=True,           # 是否执行文本检测
    rec=True,           # 是否执行文本识别
    cls=False,          # 是否执行方向分类
    ...
)

3.2 输出格式

[
    {
        "text": "识别文本",
        "confidence": 0.99,
        "text_box_position": [[x1,y1],[x2,y2],[x3,y3],[x4,y4]]
    }
]

4. 项目安装方式

4.1 完整安装

# 安装PaddlePaddle基础框架
pip install paddlepaddle

# 安装PaddleOCR完整包
pip install paddleocr[all]

4.2 轻量级安装

# 仅安装核心功能
pip install paddleocr

4.3 自定义安装

# 安装特定功能模块
pip install paddleocr[structure]  # 仅安装文档结构分析功能
pip install paddleocr[gpu]       # 安装GPU版本

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考