基本信息
- 题目:多示例学习的包相似网络
- 等级:2019年发表在sci一区期刊Information Sciences上
- bib:
@article{wang2019bag,
title={Bag similarity network for deep multi-instance learning},
author={Wang, Xinggang and Yan, Yongluan and Tang, Peng and Liu, Wenyu and Guo, Xiaojie},
journal={Information Sciences},
volume={504},
pages={578--588},
year={2019},
publisher={Elsevier}
}
核心思想
摘要
多实例学习 (MIL) 的有效性已通过其在计算机视觉、生物识别和自然语言处理中的广泛应用得到证明。最近,使用深度神经网络解决 MIL 问题已被证明是非常有效的。然而,在当前的多实例神经网络中,每个包的特征表示都是单独学习的,没有考虑包之间的关系。在这项研究中,我们提出了一种新的 MIL 神经网络,强调对包之间的亲和力进行建模。它实现了比以前的方法更有效的包表示。具体来说,具有多个实例的包通过其与其他包的相似度来建模,并且相似度计算在称为包相似度网络(BSN)的新型神经网络中进行。训练 BSN 涉及两个表示学习问题:实例特征学习和包相似度学习。为了避免这些问题复杂的相互依赖,我们通过首先训练一个实例特征学习网络,然后构建一个包相似度网络,将 BSN 训练过程解耦,每个网络都通过反向传播进行端到端优化。实验证明所提出的方法在各种 MIL 数据集上优于其他最先进的方法。
算法
图中的蓝色部分全为实例级别的全连接网络。对于一个新包
X
t
X_t
Xt,其与某个reference bag(
X
R
i
X_{R_i}
XRi)的距离矩阵(Bag similarity matrix)可如下定义:
其中
f
(
)
f()
f()为内积。
若一共有
t
t
t个reference bag,则包
X
t
X_t
Xt可用
t
t
t个以上形式的矩阵表示,论文然后提出了一种基于豪斯多夫距离的池化方式:
其中A为包
X
t
X_t
Xt与某个reference bag的距离矩阵。则该包最后可被一个
t
t
t维向量表示,最终可使用一个全连接网络进行分类。
对于reference bags的选择,文中说明是参照的Revisiting multiple
instance neural networks这篇论文中的架构。