言:
一开始训练着玩玩的就没怎么注意这个,后来动真格的了,需要训练了却忘记了如何在原来标注的数据集里添加新标注的数据集,真的找了很多方法都没有,不得已只能重新标注,字符的数据集标注及其难受,所以不得已就不停的尝试,最后好消息是找到了。
一、环境配置与训练方法以及标注方法都在下方文章中
标注方法在下方文章的第三步
PaddleOCR训练自己的数据集(中英文)(全套)和C#部署(半套)_paddleocr c#-优快云博客
一、数据集加入方式
如果你在上方文章的第三步结束了,将会生成三个文件和一个文件夹如下
其中crop_img中的图片用来训练文字识别模型,
fileState记录图片的打标完成与否,
Label为训练文字检测模型的标签,
rec_gt为训练文字识别模型的标签。
将fileState.exe内容复制添加如你原来数据集中的此文件末尾,保存
Label.txt文件中的内容亦是如此 添加到你原来的文件夹末尾,保存
接着你需要将你新标注的图片也要加入到你原来的数据集中,
最后打开PPOCRLabel.py文件运行打开标注工具选择你新旧数据集合在一起的数据集
打开数据集后可能会出现 (最好是新旧数据集再一台机子上,并且 这个文件名最好是一样的 ,路径可以不一样)
侧面这里不带勾,这个没关系 ,这是以为你路径不正确,直接往下走就行
再点击绿框的那个
观察crop_img文件夹中有没有新增识别样本
最后的最后 就可以训练了