主动学习在目标检测和语义分割中的应用
1. 目标检测中的主动学习
1.1 图像预处理
在目标检测中,根据具体应用场景,可能需要对图像进行调整大小的操作。如果你有计算机视觉相关经验,应该有自己常用的编程工具来实现图像大小调整。为了对数据进行归一化处理,可以将每个预测区域裁剪为整个图像,然后将所有样本图像缩放到相同的尺寸。例如,在一张照片中,自行车位于底部的位置可能并不重要,通过裁剪和缩放可以消除这种位置差异。
裁剪或掩码的决策应基于如何对数据进行编码以用于聚类和代表性采样:
- 若使用像素作为特征或使用单独的工具创建特征,可对图像进行裁剪,并考虑是否需要调整大小。
- 若使用用于目标检测的同一模型的隐藏层作为特征,则可以对图像进行掩码处理,而无需移动或调整大小,因为这些特征能够捕捉不同位置和尺度下对象的相似性。
1.2 采样策略
在进行聚类和代表性采样时,要确保对每张图像中不同数量对象的图像进行采样。如果只采样对象数量少或多的图像,可能会在过程中引入偏差。此时,可以采用分层采样的方法,例如分别采样 100 张预测有 1 个对象、100 张预测有 2 个对象的图像,以此类推。
1.3 主动迁移学习
主动迁移学习可以像应用于图像级标签一样应用于目标检测。还可以应用主动迁移学习进行自适应采样(ATLAS),在一个主动学习周期内进行自适应调整。因为可以假设最初采样的对象随后会由人工标注者进行修正,即使不知道具体的标签是什么。
无论使用哪种神经架构进行目标检测,都可以使用隐藏层作为二元“正确”/“错误”模型的特征,并在验证数据上进行训练。此外,还可以计算验证数据
超级会员免费看
订阅专栏 解锁全文
984

被折叠的 条评论
为什么被折叠?



