奇异值分解SVD

奇异值分解SVD详解及Python实现

最新推荐文章于 2025-10-27 23:02:21 发布

原创最新推荐文章于 2025-10-27 23:02:21 发布 · 4k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #python

奇异值分解(SVD)是一种线性代数中的矩阵分解方法，适用于非对称矩阵。SVD将矩阵A分解为UΣVT，其中U和V是正交矩阵，Σ是对角矩阵。SVD在数据降维、图像去噪、线性方程组求解等方面有广泛应用。在Python中，可以使用特征分解来计算SVD。

部署运行你感兴趣的模型镜像

一特征分解

线性代数中有个定理：实对称矩阵A（A=A^T）一定可以相似对角化于对角矩阵Σ,且一定存在一个正交矩阵Q，通过对A进行正交变换使得其变换为对角阵，即下述公式成立：
在这里插入图片描述
上述公式中，Q的列向量是矩阵A的特征向量，λ是矩阵A的特征值。将矩阵A分解为特征向量矩阵Q（也是正交矩阵)和特征值矩阵Σ的过程叫作特征分解。很显然，这样的分解是具有局限性的：

分解的对象必须是方阵
分解的对象必须是对称的

那么，如果给出的矩阵A是m*n阶的一般矩阵，是否能对其进行特征分解？
答案是可以的，奇异值分解SVD就是实现一般矩阵的分解的。

二奇异值分解（SVD）

1.SVD概述

SVD提供两组基向量（左奇异向量和右奇异向量）对数据矩阵A作行放缩和列放缩，非常适用于没有均值中心化（各数减去所在列的平均值）的稀疏数据（稀疏矩阵）。SVD方便地提供了矩阵分解和基表示以及基的重要程度（奇异值越大，越重要），被誉为“线性代数的绝对亮点”。SVD定义：对于一个m*n阶实数矩阵A，可以将其分解为如下形式：
在这里插入图片描述
上述公式中，U是一个m×m的正交矩阵（UU^T =E），其正交列称为左奇异向量；V是一个n×n的正交矩阵（VV^T =E），其正交列称为右奇异向量；Σ是一个包含奇异值的m*n的对角矩阵(注意，Σ不一定是方阵。长方形的矩阵只要其只有Σii元素是非0的，也称为对角阵)。

2.SVD性质

U中的列(左奇异向量)是AA^T 的正交特征向量。因为：L=AA^T =UΣ(V^T V)Σ^TU^T =UΣΣ^TU^T
V中的列(右奇异向量)是A^T A的正交特征向量。因为：R=A^T A=VΣ^T(U^TU)ΣV^T = VΣ^T ΣV^T
ΣΣ^T 和Σ^T Σ虽是不同的对角阵( ΣΣ^T是m×m阶的，Σ^TΣ是 n×n阶的)，但其主对角元素都是奇异值的平方。如下图所示：
一般性地，将Σ的奇异值按递减排列，U和V与之对应
SVD可以消除噪声：在实际应用中，只有前K(k<<n)个奇异值相对较大，其余的都非常小可以忽略。那么，我们选择U的前k列，V^T 的前k行，还有Σ前K个奇异值。产生原始数据A的近似矩阵：A≈Uk·Σk·Vk^T 。
SVD可以用来数据降维：Vk中的列(前k个右奇异向量)可以表示为数据集进行列规约的k维基座标，即A’=A·Vk=Uk·Σk。Uk中的列（前k个左奇异向量）可以表示为数据集进行行规约的k维基座标，即(A^T )’=A^T ·Uk=Vk·Σk。

3.SVD计算实例

给出一个数学题计算的实例：
在这里插入图片描述

三 SVD实现

1.算法描述

该算法是从纯数学计算的角度去实现SVD的，算法过程如下：

输入m×n矩阵A
计算L=AA^T 并进行特征分解，得左奇异矩阵U 和对角矩阵Λ=ΣΣ^T
Λ对角元素开根号得奇异值，生成m×n奇异值矩阵S
计算R=A^T A并进行特征分解，得右奇异矩阵V
U,S,V均按照奇异值降序排列
找到前k个最大值
计算近似矩阵A1=Uk·Sk·Vk^T
输出A1,U,S,V

显然这个算法的时间复杂度为特征分解的时间复杂度O(n³)。当然还有效率更高的算法，有兴趣者可以自行补充，本人不会。

2.python实现

看代码：

import numpy as np
import math

def SVDSplit(A):
    m=A.shape[0]
    n=A.shape[1]
    #计算左奇异矩阵U
    L=np.dot(A,A.T)
    #特征分解默认是升序
    E,U=np.linalg.eigh(L)
    #按列翻转得降序特征向量
    U=np.flip(U,axis=1)
    #生产奇异值矩阵
    S=np.zeros((m,n))
    for i in range(0,m):
        if i<n:
            e=float(E[m-i-1])
            if(e<0):#可能会产生数据溢出导致负数
                e=-e
            S[i][i]=math.sqrt(e)
    #计算右奇异矩阵V
    R=np.dot(A.T,A)
    V=np.linalg.eigh(R)[1]
    V=np.flip(V,axis=1)
    #找到K个较大值
    k=0
    min=E[0]
    max=E[-1]
    for j in range(0,m):
        #排除很小很小的奇异值
        if (E[j]/(max-min))>0.1:
            k=k+1
    UK=U[:,:k]
    SK=S[:k,:k]
    VK=V[:,:k]

    #计算近似矩阵A1
    A1=np.dot(np.dot(UK,SK),VK.T)
    return [A1,U,S,V]

测试一下：

A=np.array([2,2,1,2,0,0,
            2,3,3,3,0,0,
            1,1,1,1,0,0,
            2,2,2,3,1,1,
            0,0,0,1,1,1,
            0,0,0,2,1,2])
A=A.reshape(6,6)
A1,U,S,V = SVDSplit(A)
np.set_printoptions(precision=4)
print('近似矩阵A1：')
print(A1)
print('左奇异矩阵')
print(U)
print('奇异值矩阵')
print(S)
print('右奇异矩阵')
print(V)

运行截图如下（这是参考书里的例子，数据无误）：
在这里插入图片描述

四 SVD应用

降噪：尽管SVD中去除了较小的奇异向量的数据可能导致信息丢失，但也提升了数据表示质量。主要是因为沿着小奇异向量方向的变化通常是由噪声引起的。SVD常用于图像去模糊。
求解线性方程组：对于任意的线性方程组Ax=0,A中奇异值为0的任意右奇异向量的线性组合都是其解。
数据降维：当A是均值中心化数据时和PCA效果是相同的，因为A的右奇异矩阵V和PCA方法中A的协方差矩阵的正交特征矩阵P是相同的。
矩阵幂运算：Aⁿ =UΣⁿ V^T ，对角矩阵的幂运算就是主对角元素的n次方。
矩阵逆运算：A^-1 =VΣ^-1 U^T ,对角矩阵的逆运算就是主对角元素的倒数。

您可能感兴趣的与本文相关的镜像

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本