奇异值和特征值


定义
特征值一矩阵A作用与一向量a,结果只相当与该向量乘以一常数λ。即A*a=λa,则a为该矩阵A的特征向量,λ为该矩阵A的特征值。
奇异值:设A为m*n阶矩阵,AHAn个特征值的非负平方根叫作A的奇异值。记为σi(A)

关系
对于对称矩阵和 Hermite 矩阵而言, 一个非负的特征值也是一个奇异值,相应的特征向量是相应的左右奇异向量。 

几何意义
奇异值:对任意m×n阶距阵A做分解之后得到两个正交距阵U,V和一个广义对角阵(其中的对角元素就是奇异值),有了这样一个简单的描述后,对任意向量x,对应的变换Ax就可以用A分解后的三个距阵来计算了。这样的话,对于v阵的任一个元素Vi,经过变换AVi就可以得到唯一的一个Uiσi,这样就有了大家都知道的几何意义:当A是方阵时,其奇异值的几何意义是:若X是n维单位球面上的一点,则Ax是一个n维椭球面上的点,其中椭球的n个半轴长正好是A的n个奇异值。简单地说,在二维情况下,A将单位圆变成了椭圆,A的两个奇异值是椭圆的长半轴和短半轴。


首先,矩阵可以认为是一种线性变换,而且这种线性变换的作用效果与基的选择有关。

以Ax = b为例,x是m维向量,b是n维向量,m,n可以相等也可以不相等,表示矩阵可以将一个向量线性变换到另一个向量,这样一个线性变换的作用可以包含旋转缩放投影三种类型的效应。

奇异值分解正是对线性变换这三种效应的一个析构。
A=\mu \Sigma \sigma ^{T} \mu \sigma 是两组正交单位向量,\Sigma 是对角阵,表示奇异值,它表示我们找到了\mu \sigma 这样两组基,A矩阵的作用是将一个向量从\sigma 这组正交基向量的空间旋转\mu 这组正交基向量空间,并对每个方向进行了一定的缩放,缩放因子就是各个奇异值。如果\sigma 维度比\mu 大,则表示还进行了投影。可以说奇异值分解将一个矩阵原本混合在一起的三种作用效果,分解出来了。

特征值分解其实是对旋转缩放两种效应的归并。(有投影效应的矩阵不是方阵,没有特征值)
特征值,特征向量由Ax=\lambda x得到,它表示如果一个向量v处于A的特征向量方向,那么Av对v的线性变换作用只是一个缩放。也就是说,求特征向量和特征值的过程,我们找到了这样一组基,在这组基下,矩阵的作用效果仅仅是存粹的缩放。对于实对称矩阵,特征向量正交,我们可以将特征向量式子写成A=x\lambda x^{T} ,这样就和奇异值分解类似了,就是A矩阵将一个向量从x这组基的空间旋转到x这组基的空间,并在每个方向进行了缩放,由于前后都是x,就是没有旋转或者理解为旋转了0度。

总结一下,特征值分解和奇异值分解都是给一个矩阵(线性变换)找一组特殊的基,特征值分解找到了特征向量这组基,在这组基下该线性变换只有缩放效果。而奇异值分解则是找到另一组基,这组基下线性变换的旋转、缩放、投影三种功能独立地展示出来了。我感觉特征值分解其实是一种找特殊角度,让旋转效果不显露出来,所以并不是所有矩阵都能找到这样巧妙的角度。仅有缩放效果,表示、计算的时候都更方便,这样的基很多时候不再正交了,又限制了一些应用。
### 奇异值特征值的关系 在矩阵分析中,奇异值特征值都是描述线性变换的重要参数。对于任意给定的 \( m \times n \) 矩阵 \( A \),可以通过奇异值分解 (SVD) 将其表示为三个矩阵的乘积: \[ A = U\Sigma V^T \] 其中 \( U \) 是 \( m \times m \) 的正交矩阵,\( V \) 是 \( n \times n \) 的正交矩阵,而 \( \Sigma \) 则是一个对角矩阵,包含了所有的奇异值。 #### 特征值的概念及其性质 当考虑方阵的情况时,设有一个 \( n \times n \) 方阵 \( M \),则存在一组非零向量 \( v_i \) 及对应的标量 \( \lambda_i \),使得下述条件成立: \[ Mv_i=\lambda_iv_i \] 这些 \( \lambda_i \) 称作该矩阵特征值;相应的 \( v_i \) 被称为特征向量。如果一个矩阵拥有复数形式的特征值 \( a+bi \),那么它的共轭复数值 \( a-bi \) 同样会作为此矩阵的一个特征值出现[^1]。实部影响着特征向量的方向变化程度(即拉伸或压缩),虚部则关联到旋转效果。 #### 奇异值的特点 不同于仅对方阵定义有效的特征值概念,任何大小的矩形矩阵都可以计算出它们各自的奇异值。具体来说,在 SVD 中所提到的那个对角化后的 Σ 矩阵里每一个元素 σ 都代表了一个奇异值。值得注意的是,这里所说的 “σ” 并不是原始矩阵本身的固有属性而是通过特定方式转换而来的新度量标准。 #### 两者间的联系 对于任一矩阵 \( A \),可以构建两个新的方阵分别是 \( AA^T \) \( A^TA \)[^2]。这两个新形成的方阵都将是半正定的,并且各自具备一系列非负实数类型的特征值。特别之处在于,除了可能存在的零以外,\( AA^T \) 或者说 \( A^TA \) 的所有非零特征值正好对应于原矩阵 \( A \) 经过 SVD 分解之后获得的那些不为零的奇异值之平方根的形式。因此可以说,特征值奇异值之间存在着密切的相关性——后者实际上是对前者的一种推广发展。 ```python import numpy as np # 创建随机矩阵A np.random.seed(0) A = np.random.rand(4, 3) # 计算AA.TA.TA的特征值 eigvals_AAt = np.linalg.eigvalsh(np.dot(A, A.T)) eigvals_AtA = np.linalg.eigvalsh(np.dot(A.T, A)) print("Eigenvalues of AA.T:", eigvals_AAt[eigvals_AAt > 1e-8]) print("Eigenvalues of A.TA:", eigvals_AtA[eigvals_AtA > 1e-8]) # 对A进行SVD并打印奇异值 _, s, _ = np.linalg.svd(A) print("Singular values squared from svd(A):", s ** 2) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值