PaddleOCR训练自己的数据集（已踩坑windows10）

置顶芝士是只猫

已于 2022-07-14 15:45:17 修改

阅读量2.2w

点赞数 54

分类专栏： OCR 文章标签：深度学习 paddlepaddle python

于 2021-07-27 10:59:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_49627063/article/details/119134847

版权

OCR 专栏收录该内容

3 篇文章

订阅专栏

1.准备数据集

链接放在这里:PaddleOCR/README_ch.md at release/2.1 · PaddlePaddle/PaddleOCR · GitHub

down下来之后准备好自己的数据集

这个crop_img文件夹是通过半自动化处理后把标注的东西截取保存的文件

接下来是PPOCRLabel的打标内容：

命令行附在下面:

cd ./PPOCRLabel #将目录先切换到PPOCRLabel下

python PPOCRLabel.py --lang ch

会出现自动打标的页面

文件>打开目录>选择文件夹>左下角的自动标注

注意！因为是半自动化标注所以还要依次检查一边确认后点击右下角的确认按钮

注意:如果识别或者标记不对的地方都需要自己改动

最后点击文件>保存标记结果>保存识别结果

接下来在你的源文件夹下可以看到生成了这些内容:

Cache.cach：保存的gt框的坐标

fileState.txt：类别标签

Label.txt：保存的gt框的坐标（一般用的都是这个）

rec_gt.txt：文本识别识别结果（对应的是文本识别）

踩坑1: 你的图片需要和这些.txt等文件是同一级目录

2.需要更改配置文件的参数

configs>det>det_mv3_db.yml 文件模型

踩坑2: 如果模型地址写错会出现找不到 .pdparams的路径，也不需要加pdparams的后缀名

这里是预训练模型

下载模型地址：

PaddleOCR/models_list.md at release/2.1 · PaddlePaddle/PaddleOCR · GitHub

踩坑3:我是下载这一个，注意是训练模型是负责训练你的数据不是推理模型

data_dir 需要修改成自己的

label_file_list 自己标签的位置

踩坑4: data_dir 不要写到自己的图片目录下报错信息如下

建议调成1，因为我的电脑带不起来16,8,4线程

输入命令: python tools/train.py -c configs/det/det_mv3_db.yml

出现这种就可以了

最后训练好可以在./output/db_mv3 下面的yml中查看训练的配置文件

这里是我训练完1200个批次后生成的文件

需要将生成的转换成为infer文件命令如下:

python tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./output/db_mv3/iter
_epoch_1200 Global.save_inference_dir=./output/db_mv3_infer/

这里转换后的infer文件

换成自己的infer文件

看一下这里的检测效果

这里的识别没有写，默认的是官网可以看到准确率很高

3.模型的识别也是一样的流程

4.总结:

The ``path`` (G:/PaddleOCR-release-2.1/pretrain_models/MobileNetV3_large_x0_5_pretrained.pdparams) to loa d model not exists.‘’

出现这种错误请看2步骤的踩坑2

后续的报错信息大家可以下面留言！误人子弟的地方希望及时指出

芝士是只猫

博客等级

码龄5年

61
原创

324
点赞

1441
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

YOLO 8篇
VisionPro 10篇
深度学习 6篇
小技巧 4篇
OCR 3篇
图像处理 2篇
ROS 1篇

展开全部收起

上一篇：: PaddleOCR在Windows上的调试贫民讲解

下一篇：: 康耐视VisionPro工业标定

最新评论

PaddleOCR训练自己的数据集（已踩坑windows10）
Wuhone: 就是数据太少了，得训练一会acc才会变
PaddleOCR训练自己的数据集（已踩坑windows10）
Wuhone: 检测模型训练完以后转化成推理模型，然后去检测图片文字的时候没有任何结果显示，没转成推理模型之前测试了很准，但是转成推理模型之后，直接啥都没有了请问这是啥原因啊
PaddleOCR训练自己的数据集（已踩坑windows10）
该醒醒了~: https://blog.youkuaiyun.com/qq_65356682/article/details/140464016?spm=1001.2014.3001.5502
PaddleOCR训练自己的数据集（已踩坑windows10）
apple_50812520: 跟你一样 20张图片 1200代 acc一直是0，也没有best_accuracy,请问你解决了吗
PaddleOCR训练自己的数据集（已踩坑windows10）
apple_50812520: [2025/04/23 14:35:11] ppocr WARNING: The pretrained params neck.encoder.lstm.1.cell_fw.bias_hh not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params neck.encoder.lstm.1.cell_bw.weight_ih not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params neck.encoder.lstm.1.cell_bw.weight_hh not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params neck.encoder.lstm.1.cell_bw.bias_ih not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params neck.encoder.lstm.1.cell_bw.bias_hh not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params head.fc.weight not in model [2025/04/23 14:35:11] ppocr WARNING: The pretrained params head.fc.bias not in model rec训练时一直出现这个怎么解决？

最新文章

目录

展开全部

收起

评论 100

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

芝士是只猫 开源使得世界变得更美丽

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。