
Contribution
proposed an interpretable deep model for fine-grained visual recognition:
- 做细粒度分类,但同时output the segmentation of object parts and the identification of their contributions towards classification,增加了模型的可解释性
- 为了确认object parts,使用a simple prior (prior knowledge)。利用assumption:给定一张图,某个part出现的概率符合Beta distribution(beta distribution具体没懂,之后再了解)。
Methods
-
region-based part discovery and attribution
输入图片。输出类别,assignment map(区域分割),attention map(标出重要区域)。分三步:
- compare input feature X with part dictionary D, 得到soft part assignment map Q.
- 根据Q 和D,从X中pool出region features Z。再根据Z 进一步计算attention a。
- 用a reweight Z,算出最终结果。

该论文提出了一种可解释的深度模型用于细粒度视觉识别,不仅进行分类,还能输出对象部分的分割和它们对分类的贡献。利用先验知识确定对象部分,通过比较输入特征与部分字典得到软部分分配图,并计算注意力图。在损失函数中加入正则化项,使学习到的部分概率与先验概率分布对齐,提高了模型的解释性。实验结果展示了与其他方法相比,该模型在分类和定位错误方面的优势。
最低0.47元/天 解锁文章
1611

被折叠的 条评论
为什么被折叠?



