又回到了细粒度分类的工作,这一类工作的重点都在于attention。
菜是真的菜,同事们说话都瑟瑟发抖不敢发言,菜就是原罪,哭唧唧。
论文链接
搜了一圈好像没有代码,主要他的损失函数复现起来比较麻烦,自己写的话有点费劲
他的另一大贡献是提供了dog in wild数据,他的质量和标注都非常优秀。
主体部分
18年的ECCV,之前的细粒度都是多阶段或者多尺度,不是end to end,这篇文章提出了一个基于attention的网络,他可以提取出一个物体的不同部分。第一部分是经由压缩-多扩展one-squeeze multi-excitation(OSME)模块,提取一张图多个attention区域。第二部分是经由multi-attention multi-class constraint (MAMC),将相同class的相同attention拉近,不同attention和不同class拉远。他关注了object part correlations。
作者认为attention在细粒度分类里应遵循如下法则:
- 被检测部分应该分布在object各个不相关的特征
- 每一部分的feature对于分类是有区别的
- 这部分的计算是轻量的
One-Squeeze Multi-Excitation Attention Module
这个模块分两路,输出两个attention,这两个attention模块起到一个弱监督的作用,可以把它看成一个soft mask。
这里借鉴了senet,他在r