本篇论文是一篇关于二进制的多视聚类文章,用于处理大规模的多视数据集。
1、首先对多视数据进行哈希编码
本论文在第v个视图的数据中随机选取m个样本或者通过k-mean算法直接生成m个子簇中心
a
m
v
a_m^{v}
amv来表达这个视图的数据分布,然后计算
x
s
v
x_s^v
xsv于
a
m
v
a_m^{v}
amv的核函数。
之后乘上对其进行降维,并通过sgn()符号函数得到第v个视图的哈希矢量。
2、学习一个统一的哈希矢量
因为是多视图学习,所以一共有M个视角的哈希矢量 h s v h_s^v hsv,从中学习一个统一的哈希矢量表达式 b s b_s bs与与它们近似。
其中 α v \alpha^v αv表示的是第v个视图的权重。
公式中第三项的求方差的含义是让二值码的分布更均衡
3、进行聚类
整体的目标函数是:
之后对他们进行交替优化求解,论文中写的很详细。