
Abstract
文章认为部分类别之间由于视觉特征相似、网络feature map分辨率过小或者由于数据不均衡等原因,会使模型对这些类别感到confused。为了区分这些confusing classes,文章从网络结构设计(Discriminative Confusing Groups)和loss(Improved Cross-Entropy Loss)设计两方面做出了改进。
Discriminative Confusing Groups
其实这里可以看成是共享encoder的模型融合,将容易混淆的类别单独做loss之后进行Fusion,例如下图是cityscape的分组

分类的依据是不同类别之间的混淆矩阵:

Improved Cross-Entropy Loss
将cross entropy loss进行了类似于reweight的改进
改进前:

改进后:

实验
使用不同loss及网络结构的实验结果(cityscape)

结果还是挺不错的
这里在推荐几个关于softmax 不错的文章:
针对模型在视觉特征相似类别上的困惑,本文提出Discriminative Confusing Groups与Improved Cross-Entropy Loss,通过优化网络结构与损失函数,显著提高模型对易混淆类别的区分能力。
564

被折叠的 条评论
为什么被折叠?



