NMF(非负矩阵分解)

这段内容主要介绍了非负矩阵分解(Non-negative Matrix Factorization,简称NMF)的基本原理、目标和优化问题的形式,以下是详细解释:

非负矩阵分解(NMF)的定义和目标

  • 定义:NMF是一种矩阵分解方法,专门用于处理非负数据。给定一个非负矩阵 Y Y Y(即矩阵中的所有元素 Y i j Y_{ij} Yij 都是非负的),NMF的目标是将 Y Y Y 近似分解为两个非负矩阵 W W W H H H 的乘积,即 Y ≈ W H Y \approx WH YWH
  • 近似分解公式:对于矩阵 Y Y Y 中的每个元素 Y i j Y_{ij} Yij,可以通过 W W W H H H 的对应元素的线性组合来近似表示,具体公式为 Y i j ≈ ( W H ) i j = ∑ k = 1 r W i k H k j Y_{ij} \approx (WH)_{ij} = \sum_{k=1}^{r} W_{ik} H_{kj} Yij(WH)ij=k=1rWikHkj。其中, r r r 是隐含维度(latent dimension),它决定了分解的复杂度和精度。

矩阵 W W W H H H 的含义

  • 矩阵 W W W:矩阵 W W W r r r 列被称为基因子(basis factor),它表示原始数据中的基本组成成分。可以理解为,原始矩阵 Y Y Y 中的每一列都可以表示为 W W W 中各列的线性组合。
  • 矩阵 H H H:矩阵 H H H 的行被称为系数因子(coefficient factor),它表示原始数据中每个实例在基因子上的权重。换句话说, H H H 决定了每个实例如何由 W W W 中的基因子组合而成。
  • 基矩阵和系数矩阵:因此, W W W 被称为基矩阵(basis matrix), H H H 被称为系数矩阵(coefficient matrix)。

NMF的优化问题

  • 目标函数:在传统的NMF方法中,通过最小化 Y Y Y W H WH WH 之间的距离来求解 W W W H H H。具体的目标函数为:

min ⁡ W , H f ( W , H ) = 1 2 ∑ i = 1 n ∑ j = 1 m ( Y i j − ( W H ) i j ) 2 \min_{W, H} f(W, H) = \frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{m} (Y_{ij} - (WH)_{ij})^2 W,Hminf(W,H)=21i=1nj=1m(Yij(WH)ij)2

这个目标函数表示的是 Y Y Y W H WH WH 之间的平方误差之和。

  • 约束条件:由于NMF要求分解后的矩阵 W W W H H H 都是非负的,因此有约束条件 W i p ≥ 0 W_{ip} \geq 0 Wip0 H q j ≥ 0 H_{qj} \geq 0 Hqj0,对所有的 i , p , q , j i, p, q, j i,p,q,j 都成立。这使得NMF成为一个有界约束优化问题(bounded constrained optimization problem)。
  • Frobenius范数表示:目标函数的右侧可以形式化地表示为 ∑ i = 1 n ∑ j = 1 m ( Y i j − ( W H ) i j ) 2 = ∥ W H − Y ∥ F 2 \sum_{i=1}^{n} \sum_{j=1}^{m} (Y_{ij} - (WH)_{ij})^2 = \| WH - Y \|_F^2 i=1nj=1m(Yij(WH)ij)2=WHYF2,其中 ∥ ⋅ ∥ F \| \cdot \|_F F 表示Frobenius范数。Frobenius范数是矩阵元素的平方和的平方根,用于衡量两个矩阵之间的差异。

总结

这段内容详细介绍了NMF的基本概念、矩阵分解的公式、基矩阵和系数矩阵的含义,以及通过最小化平方误差来求解 W W W H H H 的优化问题。NMF通过将原始数据分解为基矩阵和系数矩阵,能够以一种部分基于的方式(part-based representation)来表示非负数据,广泛应用于图像处理、文本挖掘、推荐系统等领域。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阳光明媚大男孩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值