基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization, MultiGNMF)是一种结合了非负矩阵分解(NMF)和图论的多视图学习框架。
这种方法特别适用于处理包含多个不同视图或特征表示的数据集,旨在从这些视图中提取共享的潜在特征
,同时保留各视图中的局部结构信息。
MultiGNMF的目标函数
MultiGNMF的目标是找到一个共同的特征表示
,这个表示能够同时重构所有视图,并且保持每个视图的局部结构不变。
为此,MultiGNMF构建了一个基于图的模型
,其中每个节点代表一个样本
,边的权重反映了样本之间的相似度
。目标函数可以表示为:
其中,
是第
视图的
输入数据矩阵。
是第
视图的
基矩阵。
是
所有视图共享的混和矩阵
,用于表示跨视图的共同特征
。表示 Frobenius 范数,用于
度量矩阵之间的差异。
是第
视图的
拉普拉斯矩阵
,用于编码局部结构信息。表示
矩阵的迹
,即主对角线元素之和。和
是超参数,分别用于
平衡重构误差和局部结构保持的重要性。
公式解释
:表示第
视图的
非负数据矩阵
,维度通常是,其中
是样本数量,
是第
视图的
特征数量
。:
基矩阵
,维度为,其中
是潜在因子的数量,用于表示
每个视图的局部结构。
:
混和矩阵
,维度为,其中
是所有视图特征的总和,但实际上
的列数
对应于所有视图共享的潜在因子数量。
:
拉普拉斯矩阵
,用于量化每个视图中样本之间的距离或相似度
,它是由邻接矩阵
和
度矩阵
构造的,即
,其中
的元素
反映了样本
和
之间的
相似度或关联强度
,而是一个对角矩阵,其对角线元素是
:是第
视图的权重,用于
控制重构误差的贡献。
:是一个全局超参数,用于
调整局部结构保持与重构误差之间的平衡。
MultiGNMF的关键点
MultiGNMF的关键在于它不仅关注数据的重构,还强调了保留数据的局部结构。
通过使用拉普拉斯矩阵
,MultiGNMF 能够确保学习到的特征表示
在每个视图中
都能保持相邻样本之间的相似性
。
这使得 MultiGNMF 特别适合于处理具有内在局部结构的数据集,例如图像、社交网络和生物信息学数据。
MultiGNMF的求解
MultiGNMF的求解通常通过迭代优化算法完成,如梯度下降、交替最小二乘法(ALS)或其他适当的优化策略。
在每一轮迭代中,算法会交替地更新 和
MultiGNMF的应用
MultiGNMF在多个领域中都有应用,包括但不限于图像分析、文本挖掘、生物信息学和社会网络分析,特别是当数据集包含多个相关但又不同的视图时。
通过同时考虑多视图数据和局部结构信息,MultiGNMF能够提供更丰富和更全面的数据表示,有助于提高模型的准确性和泛化能力。