论文:Contextual Diversity for Active Learning
代码:https://github.com/sharat29ag/CDAL
1. 介绍
本文主要是针对深度学习任务中对聚焦目标附近的一些干扰背景做出了对应的图像代表性的表示,如下图所示,目标检测让人物中(A)-(D)中框的预测均为行人,但是行人周围出现了一些干扰背景,在四幅图中分别为围栏、自行车、自行车和建筑,那么从干扰背景多样性的角度应该选择A,C,D送给专家标注,而非同时选择有相同干扰项自行车的B,C图像。于是本文在选取高价值未标注样本的时候,考虑了针对框判别类别和干扰类别的组合的多样性,将这种多样性嵌入到之前的core-set方法和基于强化学习的主动学习算法中,在目标检测、语义分割和图像分类上都实现了不错的性能。
2. 方法
针对目标检测问题,在全部未标注图像中,一个类别c的模糊性是由每个未标注图像的类别c的模糊性加权得到的,模糊性的公式为:
Ic为未标注数量,
w
r
w_{r}
wr是分类预测概率向量的香农熵,
P
r
P_{r}
Pr是当前对输入
I
I
I预测的分类结果。
在coreset的算法中,每个样本之间的相似性改成了两个样本之间的类别模糊性分布的KL散度,并由此可以得到一个未标注图像针对标注集的相似性,作为他的代表性得分,最后仍然通过K-cente的算法实现coreset的主动学习选取策略。
3. 实验
3.1 语义分割
3.2 目标检测
3.3 图像分类