本文贡献
- 网络通过提取显著性区域并融合这些区域特征,以同时学习局部和全局的特征
- 通过混杂来自负例的注意力特征来增强网络对于每个注意力区域的学习
- 网络得到了 SOTA 的结果
动机
细粒度分类任务与常规的分类问题不同,它希望分类器能够看到不同类别之间的细微差异。当前流行的细粒度方法通常从两个方面设计以洞察到更加细微的特征:“更有区分度的表征学习”与“定位特征显著的部分”。然而,学习更有区分度的图像表征本身就是有挑战的,同时仅仅通过没有监督的分类信息也很难保证学习有显著区别的部分的准确位置。
与现有方法不同,在本文中,作者主张从对比学习的角度解决上述的困境,并提出一种新颖的注意力对比学习网络(ACLN)。该网络旨在吸引来自同一类别的正对的表示,并排斥来自不同类别的负对的表示。为了实现这个目标,提出了一个配备两个对比损失的对比学习模块。具体来说,注意力生成器生成的关注区域分别与原始CNN特征作为正对,而不同图像相应的不同注意力区域成负对。此外,最终的分类结果是通过一个协同学习模块同时利用原始特征和注意力图获得的。该方法在四个基准数据集上进行了综合实验,我们的 ACLN 在这些数据集上优于所有现有的 SOTA 方法。作者已经将代码开源: https://github.com/mpskex/AttentiveContrastiveLearningNetwork
方法
该方法主要分为了三个部分:
- 注意力生成器:用于生成需要关注的区域
- 对比学习模块:用于区分学习不同类别不同区域的特征
- 注意力特征记忆:用于为对比学习进行采样
该方法的总体框架可以参考下图: