训练paddleocr数据集在原有的数据集中加入新标注的数据一起训练（建议收藏）

最新推荐文章于 2025-03-20 11:09:28 发布

该醒醒了~

最新推荐文章于 2025-03-20 11:09:28 发布

阅读量306

点赞数 4

分类专栏： OCR 文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_65356682/article/details/145870289

版权

OCR 专栏收录该内容

5 篇文章

订阅专栏

言：

一开始训练着玩玩的就没怎么注意这个，后来动真格的了，需要训练了却忘记了如何在原来标注的数据集里添加新标注的数据集，真的找了很多方法都没有，不得已只能重新标注，字符的数据集标注及其难受，所以不得已就不停的尝试，最后好消息是找到了。

一、环境配置与训练方法以及标注方法都在下方文章中

标注方法在下方文章的第三步

PaddleOCR训练自己的数据集（中英文）（全套）和C#部署（半套）_paddleocr c#-优快云博客

一、数据集加入方式

如果你在上方文章的第三步结束了，将会生成三个文件和一个文件夹如下

其中crop_img中的图片用来训练文字识别模型，

fileState记录图片的打标完成与否，

Label为训练文字检测模型的标签，

rec_gt为训练文字识别模型的标签。

将fileState.exe内容复制添加如你原来数据集中的此文件末尾，保存

Label.txt文件中的内容亦是如此添加到你原来的文件夹末尾，保存

接着你需要将你新标注的图片也要加入到你原来的数据集中，

最后打开PPOCRLabel.py文件运行打开标注工具选择你新旧数据集合在一起的数据集

打开数据集后可能会出现（最好是新旧数据集再一台机子上，并且 这个文件名最好是一样的，路径可以不一样）

侧面这里不带勾，这个没关系，这是以为你路径不正确，直接往下走就行

再点击绿框的那个

观察crop_img文件夹中有没有新增识别样本

最后的最后就可以训练了

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

该醒醒了~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。