训练paddleocr数据集在原有的数据集中加入新标注的数据一起训练(建议收藏)

言:

    一开始训练着玩玩的就没怎么注意这个,后来动真格的了,需要训练了却忘记了如何在原来标注的数据集里添加新标注的数据集,真的找了很多方法都没有,不得已只能重新标注,字符的数据集标注及其难受,所以不得已就不停的尝试,最后好消息是找到了。

一、环境配置与训练方法以及标注方法都在下方文章中

标注方法在下方文章的第三步

PaddleOCR训练自己的数据集(中英文)(全套)和C#部署(半套)_paddleocr c#-优快云博客

一、数据集加入方式

如果你在上方文章的第三步结束了,将会生成三个文件和一个文件夹如下

其中crop_img中的图片用来训练文字识别模型,

fileState记录图片的打标完成与否,

Label为训练文字检测模型的标签,

rec_gt为训练文字识别模型的标签。

将fileState.exe内容复制添加如你原来数据集中的此文件末尾,保存

Label.txt文件中的内容亦是如此  添加到你原来的文件夹末尾,保存

接着你需要将你新标注的图片也要加入到你原来的数据集中,

最后打开PPOCRLabel.py文件运行打开标注工具选择你新旧数据集合在一起的数据集

打开数据集后可能会出现  (最好是新旧数据集再一台机子上,并且 这个文件名最好是一样的 ,路径可以不一样

侧面这里不带勾,这个没关系 ,这是以为你路径不正确,直接往下走就行

再点击绿框的那个

观察crop_img文件夹中有没有新增识别样本

最后的最后 就可以训练了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

该醒醒了~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值