陶哲轩论文解析:从特征值到特征向量
背景
陶哲轩和三个物理学家张西宁、Peter Denton和Stephen Parke的论文《EIGENVECTORS FROM EIGENVALUES》。这篇论文写了一种新的从特征值求解特征向量的方法并完成数学证明。用陶哲轩的话说:这个公式看起来好得令人难以置信,我完全没想过,子矩阵的特征值编码了原矩阵特征向量的隐藏信息。
论文地址:https://arxiv.org/abs/1908.03795
https://arxiv.org/pdf/1908.03795.pdf
什么是特征值和特征向量
对于一个n阶方阵A,存在n维非零向量x和标量λ,使下式满足:
A x = λ x Ax=λx Ax=λx即:矩阵A乘以向量x,仅对x做了线性变换λx,而未改变向量的方向。这时,对于方阵A,满足条件的λ就是特征值,x就是该特征值对应的特征向量。
教科书版求解方法
1.先求特征值
将上式改写为
( A − λ I ) x = 0 (A-λI)x=0 (A−λI)x=0该式为x的线性方程组,x存在非零解需要满足条件:
d e t ( A − λ I ) = 0 det(A-λI)=0 det(A−λI)=0det指对行列式的求解。可以得到一个关于λ的一元n次方程,包括重根可得到n个解,即为A的特征值。
2.求解特征向量
将计算得到的某特征值λ代入方程:
( A − λ I ) x = 0 (A-λI)x=0 (A−λI)x=0可以解得非零向量x为λ的特征向量。
举个栗子
太懒了不想打公式,找了个百度文库的栗子截个图
先求特征值,得到-2和7,然后分别求-2和7的特征向量。
比如求特征值-2的特征向量:
注意:特征向量是一个方向,如(4,-5),(8,-10) 都是特征值-2的特征向量,因此一般用单位向量来表示。
特征值和特征向量的主要性质
- 对于满秩矩阵,满足特征值不等于0.
- 每个n*n的方阵都有包括重根的n个特征值。
- 对于k重特征值,对应的线性无关的特征向量最多有k个。
- 对于单根特征值,有且只有一个单位特征向量。
- 两个不同的特征值,对应的特征向量一定线性无关。
- Hermitian矩阵(共轭对称矩阵)一定存在n个线性无关的特征向量。
- 所有n个特征值包括重根的乘积等于该方阵的行列式值。(在证明过程中将经常用到这个性质)
矩阵特征分解
矩阵对角化又称为矩阵的特征分解,常常应用在Hermit矩阵中。
假设现在有一个NxN的矩阵A,如果这个矩阵A有N个线性无关的特征向量,那么A就可以分解为: A = V D V − 1 A=VDV^{-1} A=VDV−1其中,D是以n个特征值为对角元素的n*n的对角阵diag{λ},V是n个特征值对应的n个线性无关的列特征向量组成的方阵
V = [ v ( 1 ) , v ( 2 ) , v ( 3 ) , . . . , v ( n ) ] V=[v^{(1)},v^{(2)},v^{(3)},...,v^{(n)}] V=[v(1),v(2),v(3),...,v(n)]
该分解常常用于实对称矩阵的分解,因为实对称的矩阵的特征值和特征向量一定为实数。
陶哲轩论文内容
下面进入正题。
陶哲轩这篇被传的神乎其神的论文到底讲了个啥。
简单摘要一下
一般的求解特征值特征向量的方法是求解特征值后将特征值带回特征方程求解线性方程组。这篇论文针对Hermitian矩阵论证了存在于特征值和特征向量信息之间的联系,提出了一种不需要知道矩阵元素,仅通过特征值和主子矩阵的特征值求解平方赋范特征向量的方法。
定义一波
- Hermitian矩阵:共轭对称矩阵。
- 主子矩阵Mi:Hermitian矩阵去掉第i行和第i列,(仍对称)
- 平方赋范特征向量:对n维特征向量x的每个值都平方一下。本文求解的仅仅是特征向量每个值的平方,没有方向。
先看看结论
这篇文章主要就是证明了一个公式。即:特征值和特征向量之间存在着的一个普遍的规律。
稍微解释一下。
A A A是需要求特征向量的Hermitian矩阵。
λ i ( A ) λ_{i}(A) λi(A)是方阵A的特征值,共n个。
M j M_{j} Mj是A的(n-1)阶的主子矩阵,共n个,每个有n-1个特征值,表示为 λ k ( M j ) λ_{k}(M_{j}) λk(Mj)
∣ v i , j ∣ 2 |v_{i,j}|^{2} ∣v