基本信息
- 题目:一种基于相似度的二视图多实例分类学习方法。
- 等级:2020年发表在sci一区期刊Knowledge-based System(KBS)。
- bib:
@article{xiao2020similarity,
title={A similarity-based two-view multiple instance learning method for classification},
author={Xiao, Yanshan and Yin, Zijian and Liu, Bo},
journal={Knowledge-Based Systems},
volume={201},
pages={105661},
year={2020},
publisher={Elsevier}
}
主要思想
摘要
在实践中,我们可能会遇到具有多个视图数据的问题。 例如,在图像分类中,总是使用文本信息来描述图像,可以将其视为双视图数据。 在本文中,我们提出了一种新的基于相似度的双视图多实例学习(STMIL)方法,可以将双视图数据纳入学习,从而提高 MIL 的分类精度。 为了获得预测分类器,我们首先将提出的模型转换为凸优化问题,然后提出一个新的替代框架来解决提出的方法。 然后,我们分析了所提出的 STMIL 方法的收敛性。 已经进行了实验以比较我们提出的方法和以前的方法的性能。 结果表明,我们的方法可以提供优于其他方法的性能。
算法
以上为双视图数据的一个例子,对于一个样本,既有图像,又有文字描述。
算法
一个实例用
{
x
i
,
m
+
(
x
i
)
,
m
−
(
x
i
)
}
\{x_i, m^+(x_i), m^-(x_i)\}
{xi,m+(xi),m−(xi)}来表示,其中
x
i
x_i
xi表示实例本身的特征值,
m
+
(
x
i
)
m^+(x_i)
m+(xi)表示该实例对于正类的相似度,
m
−
(
x
i
)
m^-(x_i)
m−(xi)表示该实例对于负类的相似度。如果
m
+
(
x
i
)
=
1
m^+(x_i)=1
m+(xi)=1则表示该实例为正,反之为负。
对于视图A,论文用
S
p
A
+
S_p^{A^+}
SpA+表示正包中的正实例,
S
a
A
+
S_a^{A^+}
SaA+表示正包中的其他实例,
S
n
A
−
S_n^{A^-}
SnA−表示负包中的实例。对于视图B,符号表示的意思相同,只是需要将A换成B。
基于以上的符号系统,论文将文字描述和图像整合成包,设计了一个基于SVM的多示例算法STMIL并给出了优化过程。
具体的实现步骤后续有空更新。