如果发现自己的数据集打错了,该怎么解决呢?

本文分享了在使用YoloX进行目标检测时遇到的标签错误问题及解决方案。通过定位并修正训练数据集中误标的标签,有效提高了模型的检测精度。

最近在跑yolox原作者的代码的时候发现了一个隐藏功能,
因为自己跑的是交通标志数据集,是自己打的标签,所以会有单词拼错了而导致精度不高的情况,我在跑之前的代码的时候就遇到,现在跑yolox的代码的时候就发现了标签错误的情况,将mandatory打成了mandatoty就会报错。

我原先在3000多张数据集里面就进行测试的时候就会发现mandatory精度很低。在这里插入图片描述
今天发现了这个问题之后就开始自己修改标签,但是标签太多了,工作量太大,但是yolox原作者的代码可以有效解决这个问题。
在/yolox/data/datasets/voc.py中只要打印img_id和name就可以有效的定位到哪一个标签打错了。
在这里插入图片描述
效果如下:
在这里插入图片描述
然后找到001336的xml就可以进行修改了。
在这里插入图片描述
还是科学技术可以解放生产力呀。。

### 如何在使用LabelImg时删除错误的标签 在使用LabelImg标注数据集的过程中,可能会遇到一些错误的标签需要删除的情况。以下是关于如何操作的具体方法: #### 删除单个错误标签 如果发现某个特定对象被错误地标记,则可以通过以下方式将其移除: - 首先选中目标框(Bounding Box),这通常通过点击对应的方框或者右侧列表中的条目完成。 - 接下来按下键盘上的 `Delete` 或者 `Backspace` 键来删除该标记[^1]。 #### 清理整个图像的所有标签 对于某些情况可能整张图都需要重新标注,在这种情况下可以一次性清除所有的现有标签而不必逐一手动去除每一个: - 打开菜单栏里的 Edit 菜单项; - 选择 Clear All Items 功能即可快速实现这一目的[^4]。 另外需要注意的是,如果您已经保存过当前正在编辑这张照片的相关信息到 XML 文件当中去之后再做上述修改动作的话,请记得再次点击 Save按钮以确保改动生效并同步至对应位置上[^2]。 此外还有可能出现由于之前定义好的类别名称发生变化而导致旧版记录无法匹配新版需求的情形下也提供了相应解决办法即保持您的标签列表在整个处理流程期间固定不变;每当存储一张新影像的同时 classess . txt文档会被自动刷新但是先前已存在的备注却不会再随之调整因此要特别留意这一点以免造成混淆误解影响最终效果评估准确性等问题发生几率增加风险提升等等不良后果产生出来哦![^3] ```python # 示例代码展示如何自动化批量清理指定路径下的xml文件内容(仅作参考用途) import os from xml.dom import minidom def clear_xml_annotations(directory_path): for filename in os.listdir(directory_path): if not filename.endswith('.xml'): continue file_path = os.path.join(directory_path, filename) dom_tree = minidom.parse(file_path) root_node = dom_tree.documentElement object_nodes = root_node.getElementsByTagName('object') while len(object_nodes) > 0: obj_to_remove = object_nodes[0] parent_obj = obj_to_remove.parentNode parent_obj.removeChild(obj_to_remove) with open(file_path, 'w') as f: dom_tree.writexml(f, addindent='\t', newl='\n') clear_xml_annotations('/path/to/your/xml/files/') ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值