基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization, MultiGNMF)是一种结合了非负矩阵分解(NMF)和图论的多视图学习框架。

这种方法特别适用于处理包含多个不同视图或特征表示的数据集,旨在从这些视图中提取共享的潜在特征同时保留各视图中的局部结构信息。

MultiGNMF的目标函数

MultiGNMF的目标是找到一个共同的特征表示,这个表示能够同时重构所有视图,并且保持每个视图的局部结构不变。

为此,MultiGNMF构建了一个基于图的模型,其中每个节点代表一个样本边的权重反映了样本之间的相似度。目标函数可以表示为:

基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵

其中,

  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_02 是第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的输入数据矩阵。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习_04 是第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的基矩阵。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_06所有视图共享的混和矩阵,用于表示跨视图的共同特征
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_07 表示 Frobenius 范数,用于度量矩阵之间的差异。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_08 是第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的拉普拉斯矩阵,用于编码局部结构信息。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_10 表示矩阵的迹,即主对角线元素之和。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习_11基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_12 是超参数,分别用于平衡重构误差和局部结构保持的重要性。
公式解释
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_02 :表示第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的非负数据矩阵,维度通常是 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_15 ,其中 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_16 是样本数量, 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_17 是第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的特征数量
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习_04基矩阵,维度为 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_20 ,其中 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_21 是潜在因子的数量,用于表示每个视图的局部结构。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_06混和矩阵,维度为 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_23 ,其中 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_24 是所有视图特征的总和,但实际上 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_06 的列数对应于所有视图共享的潜在因子数量。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_08拉普拉斯矩阵,用于量化每个视图中样本之间的距离或相似度,它是由邻接矩阵 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_27度矩阵 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_28 构造的,即 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_29 ,其中 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_27 的元素 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_31 反映了样本 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_32基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_33 之间的相似度或关联强度,而 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_28 是一个对角矩阵,其对角线元素是 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_27
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习_11 :是第 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_矩阵_03 视图的权重,用于控制重构误差的贡献。
  • 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_12 :是一个全局超参数,用于调整局部结构保持与重构误差之间的平衡。
MultiGNMF的关键点

MultiGNMF的关键在于它不仅关注数据的重构,还强调了保留数据的局部结构。

通过使用拉普拉斯矩阵 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_学习方法_39 ,MultiGNMF 能够确保学习到的特征表示 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_40 在每个视图中都能保持相邻样本之间的相似性

这使得 MultiGNMF 特别适合于处理具有内在局部结构的数据集,例如图像、社交网络和生物信息学数据。

MultiGNMF的求解

MultiGNMF的求解通常通过迭代优化算法完成,如梯度下降、交替最小二乘法(ALS)或其他适当的优化策略。

在每一轮迭代中,算法会交替地更新 基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_数据_41基于非负矩阵分解的多视图学习——基于局部结构约束的多视图特征学习方法(Multi-view Graph-based Non-negative Matrix Factorization)_相似度_40

MultiGNMF的应用

MultiGNMF在多个领域中都有应用,包括但不限于图像分析、文本挖掘、生物信息学和社会网络分析,特别是当数据集包含多个相关但又不同的视图时。

通过同时考虑多视图数据和局部结构信息,MultiGNMF能够提供更丰富和更全面的数据表示,有助于提高模型的准确性和泛化能力。