[paddleocr]PP-OCR系列模型列表

PP-OCR系列模型列表(V4,2023年8月1日更新)

说明

  1. V4版模型相比V3版模型,在模型精度上有进一步提升
  2. V3版模型相比V2版模型,在模型精度上有进一步提升
  3. 2.0+版模型和1.1版模型 的主要区别在于动态图训练vs.静态图训练,模型性能上无明显差距。
  4. 本文档提供的是PPOCR自研模型列表,更多基于公开数据集的算法介绍与预训练模型可以参考:算法概览文档

PaddleOCR提供的可下载模型包括推理模型训练模型预训练模型nb模型,模型区别说明如下:

模型类型模型格式简介
推理模型inference.pdmodel、inference.pdiparams用于预测引擎推理,详情
训练模型、预训练模型*.pdparams、*.pdopt、*.states训练过程中保存的模型的参数、优化器状态和训练中间信息,多用于模型指标评估和恢复训练
nb模型*.nb经过飞桨Paddle-Lite工具优化后的模型,适用于移动端/IoT端等端侧部署场景(需使用飞桨Paddle Lite部署)。

各个模型的关系如下面的示意图所示。

1. 文本检测模型

1.1 中文检测模型

模型名称模型简介配置文件推理模型大小下载地址
ch_PP-OCRv4_det【最新】原始超轻量模型,支持中英文、多语种文本检测ch_PP-OCRv4_det_cml.yml4.70M推理模型 / 训练模型
ch_PP-OCRv4_server_det【最新】原始高精度模型,支持中英文、多语种文本检测ch_PP-OCRv4_det_teacher.yml110M推理模型 / 训练模型
ch_PP-OCRv3_det_slimslim量化+蒸馏版超轻量模型,支持中英文、多语种文本检测ch_PP-OCRv3_det_cml.yml1.1M推理模型 / 训练模型 / nb模型
ch_PP-OCRv3_det原始超轻量模型,支持中英文、多语种文本检测ch_PP-OCRv3_det_cml.yml3.80M推理模型 / 训练模型
ch_PP-OCRv2_det_slimslim量化+蒸馏版超轻量模型,支持中英文、多语种文本检测ch_PP-OCRv2_det_cml.yml3.0M推理模型
ch_PP-OCRv2_det原始超轻量模型,支持中英文、多语种文本检测ch_PP-OCRv2_det_cml.yml3.0M推理模型 / 训练模型
ch_ppocr_mobile_slim_v2.0_detslim裁剪版超轻量模型,支持中英文、多语种文本检测ch_det_mv3_db_v2.0.yml2.60M推理模型
ch_ppocr_mobile_v2.0_det原始超轻量模型,支持中英文、多语种文本检测ch_det_mv3_db_v2.0.yml3.0M推理模型 / 训练模型
ch_ppocr_server_v2.0_det通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好ch_det_res18_db_v2.0.yml47.0M推理模型 / 训练模型

1.2 英文检测模型

模型名称模型简介配置文件推理模型大小下载地址
en_PP-OCRv3_det_slim【最新】slim量化版超轻量模型,支持英文、数字检测ch_PP-OCRv3_det_cml.yml1.1M推理模型 / 训练模型 / nb模型
en_PP-OCRv3_det【最新】原始超轻量模型,支持英文、数字检测ch_PP-OCRv3_det_cml.yml3.8M推理模型 / 训练模型
  • 注:英文检测模型与中文检测模型结构完全相同,只有训练数据不同,在此仅提供相同的配置文件。

1.3 多语言检测模型

模型名称模型简介配置文件推理模型大小下载地址
ml_PP-OCRv3_det_slim【最新】slim量化版超轻量模型,支持多语言检测ch_PP-OCRv3_det_cml.yml1.1M推理模型 / 训练模型 / nb模型
ml_PP-OCRv3_det【最新】原始超轻量模型,支持多语言检测ch_PP-OCRv3_det_cml.yml3.8M推理模型 / 训练模型
  • 注:多语言检测模型与中文检测模型结构完全相同,只有训练数据不同,在此仅提供相同的配置文件。

2. 文本识别模型

2.1 中文识别模型

模型名称模型简介配置文件推理模型大小下载地址
ch_PP-OCRv4_rec【最新】超轻量模型,支持中英文、数字识别ch_PP-OCRv4_rec_distill.yml10M推理模型 / 训练模型
ch_PP-OCRv4_server_rec【最新】高精度模型,支持中英文、数字识别ch_PP-OCRv4_rec_hgnet.yml88M推理模型 / 训练模型
ch_PP-OCRv3_rec_slimslim量化版超轻量模型,支持中英文、数字识别ch_PP-OCRv3_rec_distillation.yml4.9M推理模型 / 训练模型 / nb模型
ch_PP-OCRv3_rec原始超轻量模型,支持中英文、数字识别ch_PP-OCRv3_rec_distillation.yml12.4M推理模型 / 训练模型
ch_PP-OCRv2_rec_slimslim量化版超轻量模型,支持中英文、数字识别ch_PP-OCRv2_rec.yml9.0M推理模型 / 训练模型
ch_PP-OCRv2_rec原始超轻量模型,支持中英文、数字识别ch_PP-OCRv2_rec_distillation.yml8.50M推理模型 / 训练模型
ch_ppocr_mobile_slim_v2.0_recslim裁剪量化版超轻量模型,支持中英文、数字识别rec_chinese_lite_train_v2.0.yml6.0M推理模型 / 训练模型
ch_ppocr_mobile_v2.0_rec原始超轻量模型,支持中英文、数字识别rec_chinese_lite_train_v2.0.yml5.20M推理模型 / 训练模型 / 预训练模型
ch_ppocr_server_v2.0_rec通用模型,支持中英文、数字识别rec_chinese_common_train_v2.0.yml94.8M推理模型 / 训练模型 / 预训练模型

说明: 训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型,在真实应用场景中有着更好的表现,预训练模型则是直接基于全量真实数据与合成数据训练得到,更适合用于在自己的数据集上finetune。

2.2 英文识别模型

模型名称模型简介配置文件推理模型大小下载地址
en_PP-OCRv4_rec【最新】原始超轻量模型,支持英文、数字识别en_PP-OCRv4_rec.yml9.7M推理模型 / 训练模型
en_PP-OCRv3_rec_slimslim量化版超轻量模型,支持英文、数字识别en_PP-OCRv3_rec.yml3.2M推理模型 / 训练模型 / nb模型
en_PP-OCRv3_rec原始超轻量模型,支持英文、数字识别en_PP-OCRv3_rec.yml9.6M推理模型 / 训练模型
en_number_mobile_slim_v2.0_recslim裁剪量化版超轻量模型,支持英文、数字识别rec_en_number_lite_train.yml2.7M推理模型 / 训练模型
en_number_mobile_v2.0_rec原始超轻量模型,支持英文、数字识别rec_en_number_lite_train.yml2.6M推理模型 / 训练模型

注意: 所有英文识别模型的字典文件均为ppocr/utils/en_dict.txt

2.3 多语言识别模型(更多语言持续更新中...)

模型名称字典文件模型简介配置文件推理模型大小下载地址
korean_PP-OCRv3_recppocr/utils/dict/korean_dict.txt韩文识别korean_PP-OCRv3_rec.yml11.0M推理模型 / 训练模型
japan_PP-OCRv3_recppocr/utils/dict/japan_dict.txt日文识别japan_PP-OCRv3_rec.yml11.0M推理模型 / 训练模型
chinese_cht_PP-OCRv3_recppocr/utils/dict/chinese_cht_dict.txt中文繁体识别chinese_cht_PP-OCRv3_rec.yml12.0M推理模型 / 训练模型
te_PP-OCRv3_recppocr/utils/dict/te_dict.txt泰卢固文识别te_PP-OCRv3_rec.yml9.6M推理模型 / 训练模型
ka_PP-OCRv3_recppocr/utils/dict/ka_dict.txt卡纳达文识别ka_PP-OCRv3_rec.yml9.9M推理模型 / 训练模型
ta_PP-OCRv3_recppocr/utils/dict/ta_dict.txt泰米尔文识别ta_PP-OCRv3_rec.yml9.6M推理模型 / 训练模型
latin_PP-OCRv3_recppocr/utils/dict/latin_dict.txt拉丁文识别latin_PP-OCRv3_rec.yml9.7M推理模型 / 训练模型
arabic_PP-OCRv3_recppocr/utils/dict/arabic_dict.txt阿拉伯字母arabic_PP-OCRv3_rec.yml9.6M推理模型 / 训练模型
cyrillic_PP-OCRv3_recppocr/utils/dict/cyrillic_dict.txt斯拉夫字母cyrillic_PP-OCRv3_rec.yml9.6M推理模型 / 训练模型
devanagari_PP-OCRv3_recppocr/utils/dict/devanagari_dict.txt梵文字母devanagari_PP-OCRv3_rec.yml9.9M推理模型 / 训练模型

查看完整语种列表与使用教程请参考: 多语言模型

3. 文本方向分类模型

模型名称模型简介配置文件推理模型大小下载地址
ch_ppocr_mobile_slim_v2.0_clsslim量化版模型,对检测到的文本行文字角度分类cls_mv3.yml2.1M推理模型 / 训练模型 / nb模型
ch_ppocr_mobile_v2.0_cls原始分类器模型,对检测到的文本行文字角度分类cls_mv3.yml1.38M推理模型 / 训练模型

4. Paddle-Lite 模型

Paddle-Lite 是一个高性能、轻量级、灵活性强且易于扩展的深度学习推理框架,它可以对inference模型进一步优化,得到适用于移动端/IoT端等端侧部署场景的nb模型。一般建议基于量化模型进行转换,因为可以将模型以INT8形式进行存储与推理,从而进一步减小模型大小,提升模型速度。

本节主要列出PP-OCRv2以及更早版本的检测与识别nb模型,最新版本的nb模型可以直接从上面的模型列表中获得。

模型版本模型简介模型大小检测模型文本方向分类模型识别模型Paddle-Lite版本
PP-OCRv2蒸馏版超轻量中文OCR移动端模型11.0M下载地址下载地址下载地址v2.10
PP-OCRv2(slim)蒸馏版超轻量中文OCR移动端模型4.6M下载地址下载地址下载地址v2.10
PP-OCRv2蒸馏版超轻量中文OCR移动端模型11.0M下载地址下载地址下载地址v2.9
PP-OCRv2(slim)蒸馏版超轻量中文OCR移动端模型4.9M下载地址下载地址下载地址v2.9
V2.0ppocr_v2.0超轻量中文OCR移动端模型7.8M下载地址下载地址下载地址v2.9
V2.0(slim)ppocr_v2.0超轻量中文OCR移动端模型3.3M下载地址下载地址下载地址v2.9
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值