先看结论:
A
=
∑
i
=
1
n
λ
i
v
i
T
u
i
A = \sum_{i=1}^n \lambda_i v_i^Tu_i
A=i=1∑nλiviTui 其中
u
i
,
v
i
u_i, v_i
ui,vi 分别为
λ
i
\lambda_i
λi 的左、右特征向量。
特别地,当 A 为对称阵时, u i = v i u_i = v_i ui=vi
其实这是奇异值分解的特殊情况。
考虑 n n n 阶方阵 A A A,对每一个特征值 λ i \lambda_i λi,
右特征向量:
A
v
i
=
λ
i
v
i
,
i
=
1
,
2
,
…
,
n
Av_i = \lambda_i v_i,\quad i=1,2,\ldots,n
Avi=λivi,i=1,2,…,n
左特征向量:
u
i
T
A
=
λ
i
u
i
T
,
i
=
1
,
2
,
…
,
n
u_i^T A = \lambda_i u_i^T,\quad i=1,2,\ldots,n
uiTA=λiuiT,i=1,2,…,n
对一个特征值而言,一定有左右两个特征向量,因为由右特征向量的定义:
(
A
−
λ
i
I
)
v
=
0
(A-\lambda_i I)v = 0
(A−λiI)v=0 意味着
A
−
λ
i
I
A-\lambda_i I
A−λiI 的列线性相关,等价于不满秩,那么它必然行线性相关,则一定存在
u
u
u,使得
u
T
(
A
−
λ
i
I
)
=
0
,
u^T(A-\lambda_i I) =0,
uT(A−λiI)=0,所以左右特征向量是同时存在的。
可以证明,特征值
λ
i
\lambda_i
λi 对应的左特征向量
u
i
u_i
ui和特征值
λ
j
\lambda_j
λj的右特征向量
v
j
v_j
vj 正交。
证明如下:
A
v
j
=
λ
j
v
j
Av_j = \lambda_j v_j
Avj=λjvj
u
i
T
A
=
λ
i
u
i
T
u_i^T A = \lambda_i u_i^T
uiTA=λiuiT
u
i
T
A
v
j
=
λ
i
u
i
T
v
j
=
λ
j
u
i
T
v
j
u_i^T A v_j = \lambda_i u_i^T v_j = \lambda_j u_i^T v_j
uiTAvj=λiuiTvj=λjuiTvj
推出:
(
λ
i
−
λ
j
)
u
i
T
v
j
=
0
(\lambda_i - \lambda_j)u_i^T v_j = 0
(λi−λj)uiTvj=0
只能是
u
i
T
v
j
=
0
u_i^T v_j = 0
uiTvj=0
接下来看最终的证明:
A
[
v
1
⋯
v
n
]
=
[
v
1
⋯
v
n
]
[
λ
1
⋱
λ
n
]
A\left[\begin{matrix} v_1 & \cdots &v_n \end{matrix} \right] = \left[\begin{matrix} v_1 & \cdots &v_n \end{matrix} \right] \left[\begin{matrix} \lambda_1 & & \\ & \ddots& \\ & & \lambda_n \end{matrix} \right]
A[v1⋯vn]=[v1⋯vn]⎣⎡λ1⋱λn⎦⎤
[
u
1
T
⋮
u
n
T
]
A
=
[
λ
1
⋱
λ
n
]
[
u
1
T
⋮
u
n
T
]
\left[\begin{matrix} u_1^T \\ \vdots \\u_n^T \end{matrix} \right] A= \left[\begin{matrix} \lambda_1 & & \\ & \ddots& \\ & & \lambda_n \end{matrix} \right] \left[\begin{matrix} u_1^T \\ \vdots \\u_n^T \end{matrix} \right]
⎣⎢⎡u1T⋮unT⎦⎥⎤A=⎣⎡λ1⋱λn⎦⎤⎣⎢⎡u1T⋮unT⎦⎥⎤
所以
[
v
1
⋯
v
n
]
[
u
1
T
⋮
u
n
T
]
A
=
A
=
[
v
1
⋯
v
n
]
[
λ
1
⋱
λ
n
]
[
u
1
T
⋮
u
n
T
]
=
∑
i
=
1
n
λ
i
v
i
T
u
i
\left[\begin{matrix} v_1 & \cdots &v_n \end{matrix} \right] \left[\begin{matrix} u_1^T \\ \vdots \\u_n^T \end{matrix} \right] A= A= \left[\begin{matrix} v_1 & \cdots &v_n \end{matrix} \right] \left[\begin{matrix} \lambda_1 & & \\ & \ddots& \\ & & \lambda_n \end{matrix} \right] \left[\begin{matrix} u_1^T \\ \vdots \\u_n^T \end{matrix} \right] = \sum_{i=1}^n \lambda_i v_i^Tu_i
[v1⋯vn]⎣⎢⎡u1T⋮unT⎦⎥⎤A=A=[v1⋯vn]⎣⎡λ1⋱λn⎦⎤⎣⎢⎡u1T⋮unT⎦⎥⎤=i=1∑nλiviTui