PaddleOCR 3.1 技术文档

PaddleOCR 3.1 技术文档

【免费下载链接】PaddleOCR 飞桨多语言OCR工具包(实用超轻量OCR系统,支持80+种语言识别,提供数据标注与合成工具,支持服务器、移动端、嵌入式及IoT设备端的训练与部署) Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices) 【免费下载链接】PaddleOCR 项目地址: https://gitcode.com/paddlepaddle/PaddleOCR

1. 安装指南

1.1 环境要求

  • Python 3.8~3.12
  • 操作系统: Linux/Windows/macOS
  • 硬件支持: CPU/GPU/XPU/NPU

1.2 安装方式

通过pip安装
pip install paddleocr
通过源码安装
git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
pip install -r requirements.txt
python setup.py install

2. 项目使用说明

2.1 快速开始

from paddleocr import PaddleOCR

# 初始化OCR模型
ocr = PaddleOCR(use_angle_cls=True, lang="ch")

# 执行OCR识别
result = ocr.ocr("test.jpg", cls=True)

# 打印识别结果
for line in result:
    print(line)

2.2 核心功能

  • PP-OCRv5: 通用场景文本识别,支持5种文本类型
  • PP-StructureV3: 复杂文档解析,输出结构化Markdown/JSON
  • PP-ChatOCRv4: 智能信息提取,集成ERNIE 4.5模型

3. 项目API使用文档

3.1 主要API接口

初始化OCR引擎
PaddleOCR(
    det_model_dir=None,  # 检测模型路径
    rec_model_dir=None,  # 识别模型路径
    cls_model_dir=None,  # 方向分类模型路径
    use_angle_cls=False, # 是否使用方向分类
    lang="ch",           # 语言类型
    ...
)
执行OCR识别
ocr.ocr(
    img_path,           # 图片路径或numpy数组
    det=True,           # 是否执行文本检测
    rec=True,           # 是否执行文本识别
    cls=False,          # 是否执行方向分类
    ...
)

3.2 输出格式

[
    {
        "text": "识别文本",
        "confidence": 0.99,
        "text_box_position": [[x1,y1],[x2,y2],[x3,y3],[x4,y4]]
    }
]

4. 项目安装方式

4.1 完整安装

# 安装PaddlePaddle基础框架
pip install paddlepaddle

# 安装PaddleOCR完整包
pip install paddleocr[all]

4.2 轻量级安装

# 仅安装核心功能
pip install paddleocr

4.3 自定义安装

# 安装特定功能模块
pip install paddleocr[structure]  # 仅安装文档结构分析功能
pip install paddleocr[gpu]       # 安装GPU版本

【免费下载链接】PaddleOCR 飞桨多语言OCR工具包(实用超轻量OCR系统,支持80+种语言识别,提供数据标注与合成工具,支持服务器、移动端、嵌入式及IoT设备端的训练与部署) Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices) 【免费下载链接】PaddleOCR 项目地址: https://gitcode.com/paddlepaddle/PaddleOCR

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值