对于 A u ⃗ = λ u ⃗ A\vec u = \lambda \vec u Au=λu,对应一个特征值 λ \lambda λ 的特征向量不唯一;求解特征向量的过程在于求解齐次线性系统 ( A − λ I ) u ⃗ = O (A - \lambda I)\vec u = O (A−λI)u=O,并且由于 u ⃗ ! = O \vec u != O u!=O,所以该线性系统存在一组解 [ u ⃗ 1 , u ⃗ 2 . . . ] [\vec u_1,\vec u_2...] [u1,u2...],也即特征向量组成了 A − λ I A - \lambda I A−λI的零空间(刨除零向量)。
对应特征值 λ \lambda λ 的特征向量的解空间又称 λ \lambda λ 的特征空间( E λ E_{\lambda} Eλ ) : E λ = { O } ∪ { λ 的特征向量 } \, \, E_{\lambda} = \{O\} \cup \{\lambda \small 的特征向量\} Eλ={O}∪{λ的特征向量}。
对于一个 n n n阶变换矩阵 A A A,则其对应求解特征向量的行列式 det ( A − λ I ) = O \det (A - \lambda I) = O det(A−λI)=O展开后得到的将是一个关于 λ \lambda λ的 n n n 次方程(在实数域和复数域内, λ \lambda λ对应 n n n个解)。
关于特征值的解的3种情况:
①
λ
\lambda
λ在实数域内存在
n
n
n个互不相等的解,
n
1
!
=
n
2
!
=
.
.
.
!
=
n
n
n_1 \ \ != n_2 \ \ != ... \ \ != n_n
n1 !=n2 !=... !=nn,这些特征值称为简单特征值(应用最多);
②
λ
\lambda
λ在实数域内存在的
n
n
n个解中包含重复值,
n
i
=
n
j
=
.
.
.
=
n
k
n_i = n_j =... = n_k
ni=nj=...=nk,则称这些重复的特征值为多重特征值,使用
重数
\color {red} {\small 重数}
重数来描述重复特征值的重复次数;
③
λ
\lambda
λ在实数域内无解,仅在复数域有解,如
det
(
A
−
λ
I
)
=
λ
2
+
1
=
0
→
λ
1
=
i
;
λ
2
=
−
i
\det (A - \lambda I) = \lambda ^2 + 1 = 0 \rightarrow \lambda_1 = i ; \lambda_2 = -i
det(A−λI)=λ2+1=0→λ1=i;λ2=−i ,这种情况称为复数特征值。
如果存在 λ = 0 \lambda = 0 λ=0是矩阵 A A A的一个特征值,意味着对于线性方程 A u ⃗ = λ u ⃗ → A u ⃗ = O A\vec u = \lambda \vec u \rightarrow A\vec u = O Au=λu→Au=O,要使得 u ⃗ ≠ O \vec u \neq O u=O,则矩阵 A A A一定不可逆,所以当矩阵 A A A可逆就有 λ ≠ 0 \lambda \neq 0 λ=0。
#####关于一些特殊矩阵的特征方程求解:
① 对角矩阵
A
=
[
d
1
0
.
.
.
0
0
d
2
.
.
.
0
0
0
.
.
.
d
n
]
→
det
(
A
)
=
d
1
∗
d
2
∗
.
.
.
∗
d
n
A =\ \ \ \ \ \ \begin {bmatrix} d_1&0&...&0 \\ 0&d_2&...&0 \\ 0&0&...&d_n \\ \end {bmatrix} \rightarrow \ \ \ \ \ \ \ \ \ \ \ \ \det(A) = d_1*d_2*...*d_n
A=
d1000d20.........00dn
→ det(A)=d1∗d2∗...∗dn
A − λ I = [ d 1 − λ 0 . . . 0 0 d 2 − λ . . . 0 0 0 . . . d n − λ ] → det ( A − λ I ) = ( d 1 − λ ) ∗ ( d 2 − λ ) ∗ . . . ∗ ( d n − λ ) A-\lambda I = \begin {bmatrix} d_1 - \lambda&0&...&0 \\ 0&d_2 - \lambda&...&0 \\ 0&0&...&d_n - \lambda \\ \end {bmatrix} \rightarrow \det(A-\lambda I) = (d_1 - \lambda)*(d_2 - \lambda)*...*(d_n - \lambda) A−λI= d1−λ000d2−λ0.........00dn−λ →det(A−λI)=(d1−λ)∗(d2−λ)∗...∗(dn−λ)
∴ λ 1 = d 1 ; λ 2 = d 2 ; . . . λ n = d n \therefore \lambda_1 = d_1;\lambda_2 = d_2;...\lambda_n = d_n ∴λ1=d1;λ2=d2;...λn=dn
同理可直接求取上三角,下三角形状的变换矩阵 A A A的特征值。
关于特征值的一些基本性质:
-
若 λ \lambda λ是 A A A的特征值,则有 λ m \lambda ^m λm是 A m A ^m Am的特征值 ( m ≥ 1 ) (m \ge 1) (m≥1);
\, \, \, \, \, 数学归纳 ∵ m = 1 \because m =1 ∵m=1 成立, A u ⃗ = λ u ⃗ A\vec u = \lambda \vec u Au=λu
\, \, \, \, \, \, \, \, \, \, \, \, \, 假设 m = k A k u ⃗ = λ k u ⃗ \, \, m =k A ^ k \vec u = \lambda ^ k \vec u m=kAku=λku
\, \, \, \, \, \, \, \, \, \, \, \, \, 当 m = k + 1 \, \, \, \, \, m =k+1 m=k+1 时, A k + 1 u ⃗ = A ∗ A k u ⃗ = A u ⃗ ∗ λ k = λ u ⃗ ∗ λ k = λ k + 1 u ⃗ A ^ {k+1} \vec u = A * A^k \vec u = A \vec u* \lambda ^ k = \lambda \vec u * \lambda ^ k = \lambda ^ {k+1} \vec {u} Ak+1u=A∗Aku=Au∗λk=λu∗λk=λk+1u 得证假设。 -
若 λ \lambda λ是 A A A 的特征值,则有 λ − 1 \lambda ^{-1} λ−1 是 A − 1 A ^{-1} A−1 的特征值(已给出前提矩阵 A A A可逆);
\, \, \, \, \, 由 A u ⃗ = λ u ⃗ \, \, A\vec u = \lambda \vec u Au=λu
A − 1 ∗ A u ⃗ = A − 1 ∗ λ u ⃗ \, \, \, \, \, \, \, \, \, \, \, A^{-1}* A\vec u = A^{-1}* \lambda \vec u A−1∗Au=A−1∗λu
u ⃗ = λ ∗ A − 1 u ⃗ → u ⃗ λ − 1 = A − 1 u ⃗ \, \, \, \, \, \, \, \, \, \, \, \, \vec u = \lambda*A^{-1}\vec u \rightarrow \vec u \lambda ^{-1} = A^{-1}\vec u u=λ∗A−1u→uλ−1=A−1u得证。
在线性代数上的理解:
通过特征值分解可以得到特征值与特征向量,特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么,可以将每一个特征向量理解为一个子空间,我们可以利用这些线性的子空间干很多的事情。
线性变换矩阵的特征值和特征空间–几何理解
- 投影变换
在二维空间,把任意向量都投影到 u ⃗ = ( 2 , 1 ) \vec u = (2,1) u=(2,1)所在直线的变换中,变换前后方向保持不变的向量 A a ⃗ = a ⃗ ′ = λ a ⃗ A\vec a = \vec a{'}= \lambda \vec a Aa=a′=λa将存在于直线 y = 0.5 x y = 0.5x y=0.5x上,且这些向量经投影变换后大小不变即 λ = 1 \lambda = 1 λ=1,所以该直线上的所有向量构成了投影矩阵 A A A中 λ = 1 \lambda =1 λ=1的解空间。除了直线上的向量,垂直于直线的向量投影到直线上将变成零向量 O O O,而 O O O与变换前的向量同向,不过长度为零,所以垂直于 y = 0.5 x y = 0.5x y=0.5x的直线上的所有向量构成了投影矩阵 A A A中 λ = 0 \lambda =0 λ=0的解空间。
- 对称变换
在二位空间中,变化矩阵 A = [ 0 1 1 0 ] A= \begin {bmatrix} 0&1 \\ 1&0 \end {bmatrix} A=[0110]将平面上的所有向量关于直线 y = x y = x y=x 对称变换。那么对处于 y = x y = x y=x直线上的任意向量,对称前后将等大同向,所以这些向量构成了 A A A中 λ = 1 \lambda =1 λ=1 的解空间。而对于垂直于 y = x y = x y=x 的直线 y = − x y = -x y=−x 上的向量,这些向量对称前后将等大反向,因此构成了 A A A中 λ = − 1 \lambda =-1 λ=−1的解空间。
旋转矩阵的特征值和特征空间–几何理解
对于空间中任意一个向量 u ⃗ \vec u u经过旋转变换得到的向量 v ⃗ \vec v v,几何中不会存在任何 v ⃗ \vec v v与向量 u ⃗ \vec u u同向。所以,对于旋转矩阵 A A A,如逆时针90°旋转矩阵 A = [ 0 − 1 1 0 ] A= \begin {bmatrix} 0&-1 \\ 1&0 \end {bmatrix} A=[01−10],求解其特征值将得到 det ( A − λ I ) = O → λ 2 + 1 = 0 \det(A - \lambda I) = O \rightarrow \lambda ^2 + 1 = 0 det(A−λI)=O→λ2+1=0,意味着其特征值只能在复数空间寻求解。