NMF学习

本文详细介绍了非负矩阵因式分解(NMF)的基本原理及其在数据压缩、聚类和推荐系统中的应用。NMF能将原始数据矩阵分解成两个非负因子矩阵,即权重矩阵W和特征矩阵H,从而实现数据的有效降维。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NMF:非负矩阵因式分解。 NMF一直被认为是对多维数据分解的一个很有效的方法,包括在聚类和推荐系统中应用等。

NMF矩阵算法介绍:

给定一个非负矩阵V,我们可以找到2个非负分解因子矩阵W,H.其中,W称为权重矩阵,H称为特征矩阵。公式如下:

NMF

当n维数据向量集放置在n*m的矩阵V中,其中m是数据集的大小。V分解的的权重矩阵W:n*r;V分解的特征矩阵H: r*m; 通常r小于n,m。 r表示采用的特征数。这个可以认为是一种数据压缩方法。

这里,关键为题是如何计算出W,H矩阵?

首先我们构造一个代价函数:

NMF代价函数J可以重写为:

NMF

这是个典型的优化问题,这里采用拉格朗日乘法去优化J。

构造拉格朗日函数L:



说明如下:W,H的每个元素必须大于等于0,这样设置

NMF

NMF



拉格朗日乘法因子。其中

NMF


这样,做L对W,H进行求偏导如下:


NMF

根据KKT条件:

NMF所以,得到如下:

NMF


根据以上等式,我们可以得出一个乘法迭代更新公式:

NMF

到目前为止,我们基本上描述完了利用乘法更新规则求解NMF的过程。

其实,可以看出来,根据上面的规则:W,H不是唯一的。

若果想使W,H唯一,我们可以设定(当然这只是其中一种假设方法)W的列向量欧式距离长度为1,就对W进行列的归一化处理:

NMF


参考文献:

【1】Daniel D. Lee. Algorithms for Non-negative Matrix Factorization

【2】Wei Xu, Xin Liu, Yihong Gong.Document Clustering Based On Non-negative Matrix Factorization


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值