机器学习任务中的标注质量
在机器学习领域,标注质量对于模型的训练和性能至关重要。本文将深入探讨目标检测和语义分割这两个重要任务中的标注质量相关问题。
1. 目标检测的标注质量
1.1 调整随机因素下的指标
在目标检测中,为了调整随机因素的影响,可以将标注框内图像的占比作为基线。例如,若一个标注的交并比(IoU)为 0.8,且目标占图像的 10%,则调整后的 IoU 计算如下:
[
Adjusted\ IoU = 0.8 - \frac{0.1}{1 - 0.1} = 0.6889
]
IoU 比精确率、召回率和 F 分数更为严格,在相同数据下其值往往更低。如果使用精确率、召回率和 F 分数代替 IoU,仍需以整个图像目标为基础调整随机因素,但计算结果会有所不同。假设同一目标占图像 10%,标注的 F 分数为 0.9,则:
- 预期精确率:(Expected\ precision = 0.1)
- 预期召回率:(Expected\ recall = 1.0)
- 预期 F 分数:(Expected\ F - score = \frac{2\times0.1\times1.0}{0.1 + 1.0} = 0.1818)
- 调整后的 F 分数:(Adjusted\ F - score = 0.9 - \frac{0.1818}{1 - 0.1818} = 0.6778)
可以看到,尽管初始的 IoU 和 F 分数有 10%的差异,但调整随机因素后,它们的差异缩小到了约 1%。你可以在自己的数据集上进行实验,观察这两种准确性评估方法是否存在显著差异。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



