一、简介
题目: A Unified Objective for Novel Class Discovery
会议: ICCV 2021
任务: 给定一个数据集,其中部分样本有标签(可认为它们属于已知类),其余样本无标签(可认为它们属于新类/未知类,未知类与已知类不重叠),要求模型保留对已知类的分类能力同时对无标签样本进行聚类,或称新类发现(Novel Category Discovery,NCD)。
Note: Open World Semi-Supervised Learning、Generalized Category Discovery、Parametric Classification for Generalized Category Discovery对NCD进行了扩展,他们允许无标签样本中包含属于已知类的数据。此外,该方法假设新类数量已知,这通常是不现实的,AutoNovel: Automatically Discovering and Learning Novel Visual Categories和Generalized Category Discovery都提出了解决方案。
方法:
(1)建立包含编码器(ResNet18)、有标签分类头(原型线性层)、无标签分类头(映射头MLP+线性层)的网络,将有标签分类头和无标签分类头的logits(未经SoftMax的输出)拼接(concat)起来,再经SoftMax层后由标准交叉熵优化;
(2)对一个图像随机增强出两个视图,有标签时两个视图与原图像标签相同,无标签时,通过Sinkhorn-Knopp algorithm求解伪标签,再将所得两个视图生成的伪标签互换来保证预测一致性;
(3)设置更多的无标签分类头和更大的无标签分类头输出单元以提升聚类精度。
如图,该方法(UNO)使用了一个统一的目标函数(标准交叉熵)。
二、详情
1. 网络搭建

如图,有标签数据 D l D^l Dl和无标签数据 D u D^u Du都会通过两次随机增强得到两个视图。之后输入网络,网络包含编码器(ResNet18)、有标签分类头(原型线性层)、无标签分类头(MLP+线性层),编码器和头都是共享的。
然后,连接有标签头( h h h)和无标签头( g g g)的logits输出,经SoftMax层得到后验概率,有了该概率即可与真实标签或伪标签一起通过交叉熵训练网络。标签需由zero-pad进行扩充才能在尺寸上与概率匹配,公式如下:
y = { [ y l , 0 C u ] , x ∈ D l [ 0 C l , y ^ ] , x ∈ D u y=\left\{\begin{aligned}[\pmb y^l,\pmb 0_{C^u}], \pmb x\in D^l \\ [\pmb 0_{C^l},\hat{\pmb y}], \pmb x\in D^u \end{aligned}\right. y={
[yl,0Cu],x∈Dl[0Cl,y^],x∈Du其中, y l \pmb y^l yl和 y ^ \hat{\pmb y} y^为有标签数据的标签和无标签数据的伪标签,

文章介绍了一种在ICCV2021会议上提出的无监督新类别发现方法,称为UNO。该方法利用ResNet18作为编码器,结合有标签和无标签分类头,通过标准交叉熵优化网络。对于无标签数据,使用Sinkhorn-Knoppalgorithm生成伪标签,并通过交换预测任务确保一致性。此外,通过多头聚类和过聚类策略提高聚类精度,适应在线学习场景。
最低0.47元/天 解锁文章
1078





