Non-Negative Matrix Factorization 非负矩阵分解（NMF）

最新推荐文章于 2024-03-01 11:45:00 发布

周杰伦的新晋迷弟

最新推荐文章于 2024-03-01 11:45:00 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：基础知识

本文链接：https://blog.youkuaiyun.com/Hahapipi108/article/details/108243015

基础知识专栏收录该内容

1 篇文章

订阅专栏

非负矩阵分解（NMF）是一种在所有元素均为非负数约束条件下的矩阵分解方法，由D.D.Lee和H.S.Seung于1999年提出。NMF能够将一个非负矩阵分解为两个非负矩阵的乘积，常用于数据压缩、特征提取和降维。本文详细介绍了NMF的基本思想、问题描述、算法流程以及应用案例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Non-Negative Matrix Factorization 非负矩阵分解（NMF）

简介及基本思想

1999年由D.D.Lee和H.S.Seung提出的新的矩阵分解思想，在矩阵中所有元素均为非负数约束条件下的矩阵分解方法，通过矩阵分解，可以对描述问题的矩阵进行将为，另一方面可以对大量的数据进行压缩和概括。

原文论文为：《Algorithms for Non-negative Matrix Factorization》

NMF的基本思想为：对于任意给定的一个非负矩阵A，NMF可以找到两个非负矩阵U和V，使得满足A=UV，从而将一个非负矩阵分解为左右两个非负矩阵的乘积。

问题描述

利用公式描述为：
$V_{n*m}\approx W_{n*r}\cdot H_{r*m}$
公式中的约等于是因为当前解法并非精确解，而只是数值上的近似解，并且r远远小于n和m，一般情况下满足(n+m)r<nm。在有的文献中，r也被称为隐藏空间的维度。

因为原矩阵V中的一列向量可以解释为W矩阵中所有列向量的加权和，并且权重系数对应为H矩阵中对于列向量的元素，因此一般称W矩阵为基矩阵，而H为权矩阵。

在论文中指出，非负矩阵分解是一个NP问题，可以划分为优化问题用迭代方法交替求U和V。

具体算法流程

损失函数

欧式距离：

${\left\Vert A-B \right\Vert}^2 =\sum_{ij}(A_{ij}-B_{ij})^2$

AB之间的散度：

$D(A\|B)=\sum_{ij}(A_{ij}\log\frac{A_{ij}}{B_{ij}}-A_{ij}+B_{ij})$

基于乘法更新法阵的迭代更新算法，将矩阵分解算法转化为最小化两个矩阵之间的欧几里得距离的优化问题：
$\min{\left\Vert V-V' \right\Vert}^2 =\sum_{ij}(V_{ij}-V'_{ij})^2$
其中V是原始矩阵，V'是分解后的矩阵重构而成的矩阵，乘法更新规则如下，首先是H矩阵，权矩阵：
$H_{a\mu}\leftarrow H_{a\mu}\frac{(W^TV)_{a\mu}}{(W^TWH)_{a\mu}}$
其中a和mu指的是矩阵的第a行第mu列元素，当分母的等式为0的时候，对应位置元素不做更新。