降维算法之SVD（奇异值分解）

最新推荐文章于 2025-05-05 14:03:24 发布

文弱_书生

最新推荐文章于 2025-05-05 14:03:24 发布

阅读量669

点赞数 20

分类专栏：降维算法整理文章标签：算法降维算法奇异值分解 SVD

本文链接：https://blog.youkuaiyun.com/qq_45670407/article/details/146997728

版权

降维算法整理专栏收录该内容

10 篇文章

订阅专栏

奇异值分解（Singular Value Decomposition，SVD）算法详解

先说理解：

奇异值分解（SVD，Singular Value Decomposition）是一种数学工具，通俗来说，它就像一个“数据拆解大师”，能把一个复杂的数据表格（矩阵）拆成三个简单部分，让你更容易理解数据的结构和重要信息。

让我用一个生活化的例子来解释：

场景：拆解食谱

假设你有一张大表格，记录了不同餐厅的菜品评分：行是顾客，列是菜品，数字是评分（比如小明给宫保鸡丁打了4分）。这张表很乱，你想弄清楚里面的规律。SVD 就像一个厨师，把这张表拆成三部分：

顾客偏好表（U）：告诉你每个顾客喜欢什么类型的菜（比如小明偏爱辣的）。
菜品重要性表（Σ）：列出每种“菜品类型”的重要程度（比如“辣味”比“甜味”更关键）。
菜品类型表（V^T）：告诉你每道菜属于哪种类型（比如宫保鸡丁是“辣味型”）。

通过这三个部分，你就能大致重现原来的评分表，还能看出哪些因素最重要。

怎么工作的？

SVD 把一个矩阵 ( A )（比如评分表）分解成：
[ A = U \cdot \Sigma \cdot V^T ]

U：左奇异向量矩阵，描述行（顾客）的模式。
Σ：对角矩阵，里面的值（奇异值）表示每种模式的“重要性”，从大到小排列。
V^T：右奇异向量矩阵，描述列（菜品）的模式。

这三个部分就像拼图，把它们乘回去，就能还原 ( A )。

举个例子

假设你有3个顾客和3道菜的评分矩阵：

   宫保鸡丁  糖醋排骨  清蒸鱼
小明   4         2         1
小红   3         3         1
小刚   5         1         2

SVD 会拆出：

U：顾客对“辣”“甜”等口味的偏好。
Σ：告诉你是“辣”最重要（奇异值大），还是“甜”更关键。
V^T：每道菜的口味成分（宫保鸡丁偏辣，糖醋排骨偏甜）。

生活中的意义

SVD 就像你在整理杂物，把一堆东西拆成“类别”“重要性”和“特征”，还能用来压缩数据：

如果只保留最大的几个奇异值（Σ 里的前几项），就能用更少的信息大致还原原表，像图片压缩。
在推荐系统里，SVD 能找出你喜欢的电影类型，推荐相似电影。

和 PCA 的关系

PCA 其实是 SVD 的“亲戚”，PCA 用 SVD 来找数据的“主成分”，但 SVD 更通用，能处理任何矩阵。

简单来说，SVD 就是：把复杂数据拆成三块拼图，抓住核心规律，还能压缩简化！

1. SVD 算法简介

奇异值分解（SVD）是一种非常重要的矩阵分解技术，在数值分析、信号处理、推荐系统、自然语言处理等领域广泛应用。SVD 可以将任意矩阵分解为三个矩阵的乘积：一个正交矩阵、一个对角矩阵和另一个正交矩阵。这种分解帮助我们理解矩阵的性质，尤其是在低秩近似、降维和特征提取等任务中非常有用。

对于一个给定的矩阵 $\in \mathbb{R}^{m \times n}$ ，SVD 将其分解为三个矩阵的乘积：
$\Sigma V^T$
其中：

$U$ 是一个 $\times m$ 的正交矩阵，包含了 $A$ 的左奇异向量（即 $A$ 的列空间的正交基）。
$\Sigma$ 是一个 $\times n$ 的对角矩阵，对角线上的元素为奇异值，表示矩阵的“伸缩”程度。奇异值按降序排列。
$V^T$ 是一个 $\times n$ 的正交矩阵，包含了 $A$ 的右奇异向量（即 $A$ 的行空间的正交基）。

2. SVD 的数学原理

2.1. 奇异值分解的推导

给定一个矩阵 $\in \mathbb{R}^{m \times n}$ ，SVD 的目标是将其表示为 $\Sigma V^T$ 。为了得到这样的分解，我们需要找到矩阵 $A$ 的特征值和特征向量：

左奇异向量 $U$ 是 $A A^T$ 的特征向量。
右奇异向量 $V$ 是 $A^T A$ 的特征向量。

通过特征分解，我们可以计算得到矩阵 $A$ 的奇异值。奇异值是 $A$ 的非负平方根特征值，按降序排列。

2.2. 奇异值的性质

奇异值 $\sigma_i$ 是矩阵 $A$ 的对角矩阵 $\Sigma$ 中的元素。
如果矩阵 $A$ 是秩 $r$ 的矩阵，那么 $A$ 将有 $r$ 个非零的奇异值，其他的奇异值为零。

2.3. 矩阵的低秩近似

SVD 使得我们可以通过截断小的奇异值来进行矩阵的低秩近似。具体来说，如果我们只保留前 $k$ 个最大的奇异值及其对应的奇异向量，我们可以得到一个秩为 $k$ 的矩阵，该矩阵能很好地逼近原矩阵。

对于给定的矩阵 $A$ ，使用前 $k$ 个奇异值的低秩近似可以表示为：
$A_k = U_k \Sigma_k V_k^T$
其中， $U_k$ 、 $\Sigma_k$ 和 $V_k$ 分别是保留前 $k$ 个奇异值及其对应的奇异向量所得到的矩阵。

3. SVD 的应用

降维
SVD 在降维中的一个重要应用是主成分分析（PCA），其中通过选择最大的奇异值及其对应的奇异向量来减少数据的维度。
矩阵压缩
SVD 通过低秩近似可用于矩阵压缩，尤其是在处理图像和文档数据时。在压缩过程中，保留前几个最大的奇异值和奇异向量能够显著减少存储需求，同时尽可能保留矩阵的核心信息。
推荐系统
在推荐系统中，SVD 用于分解用户-物品矩阵，帮助发现潜在的用户兴趣和物品特征，从而提供个性化推荐。
噪声去除和信号处理
SVD 可以用于去除噪声和提取信号。通过低秩近似，可以去除矩阵中的噪声成分，只保留重要的信号部分。

4. SVD 的计算步骤

计算 $A^T A$ 和 $A A^T$ 的特征值和特征向量：
通过特征分解，得到矩阵 $A^T A$ 和 $A A^T$ 的特征向量，进而得到矩阵 $V$ 和 $U$ 。
计算奇异值：
奇异值是 $A^T A$ 或 $A A^T$ 的特征值的平方根。将奇异值按降序排列。
构造矩阵 $\Sigma$ ：
将奇异值按降序排列，构造矩阵 $\Sigma$ ，其为对角矩阵。

5. SVD 的 Python 实现

import numpy as np
import matplotlib.pyplot as plt

# 生成一个随机矩阵 A
A = np.random.rand(5, 3)

# 执行 SVD
U, Sigma, Vt = np.linalg.svd(A)

# Sigma 是一个包含奇异值的数组，需要转换成对角矩阵
Sigma_matrix = np.diag(Sigma)

# 输出 SVD 分解结果
print("U matrix:\n", U)
print("\nSigma matrix:\n", Sigma_matrix)
print("\nVt matrix:\n", Vt)

# 通过 SVD 结果重建矩阵 A
A_reconstructed = np.dot(U, np.dot(Sigma_matrix, Vt))
print("\nReconstructed matrix A:\n", A_reconstructed)