集成鲁棒图正则非负矩阵分解方法解析
1 引言
在多维度基因组数据分析领域,矩阵分解是一种重要的技术。集成鲁棒图正则非负矩阵分解(iRGNMF)模型应运而生,它通过引入图的规律性和 L2,1 - 范数,不仅能探索数据自身几何结构中的有价值信息,还提高了模型的鲁棒性,并且其求解过程可通过乘法更新算法直接完成,简单易懂。
2 相关工作
2.1 非负矩阵分解(NMF)
NMF 模型将一个输入矩阵分解为两个元素均为非负的输出矩阵。对于输入数据矩阵 (X = [x_1, x_2, x_3, \cdots, x_M ] \in R^{m×n}),其中 (m) 是输入数据矩阵的特征数量,(n) 是输入数据矩阵的样本数量。NMF 的表达式为:
[
X = AY,
\quad
\text{s.t. } A \geq 0, Y \geq 0.
]
为了降低数据维度,NMF 最小化以下目标函数:
[
O_{NMF} = |X - AY| F^2,
]
其中 (|\cdot|_F) 表示矩阵的 F - 范数。Lee 和 Seung 提出了一种迭代更新算法:
[
a {ik} \leftarrow a_{ik} \frac{(XY^T) {ik}}{(AYY^T) {ik}},
]
[
y_{jk} \leftarrow y_{jk} \frac{(A^TX) {jk}}{(A^TAY) {jk}}.
]
已证明上述迭代更新算法是收敛的。