1. 引言
这里略去若尔当块和若尔当矩阵的定义,主要是想谈谈自己对若尔当标准型的理解。
我们都知道的简单结论是,对于nnn阶方阵AAA,如果AAA有nnn个互异的特征值λ1,...,λn\lambda_1,...,\lambda_nλ1,...,λn,那么AAA是可以对角化的,并且向量空间V=ker(A−λ1I)+...+ker(A−λnI)V=ker(A-\lambda_1 I)+...+ker(A-\lambda_n I)V=ker(A−λ1I)+...+ker(A−λnI)。
实际上对角化的过程也就是将全空间分解成矩阵AAA的不变子空间的直和的过程,比如V=ker(A−λ1I)+...+ker(An−λnI)V=ker(A-\lambda_1 I)+...+ker(A_n-\lambda_n I)V=ker(A−λ1I)+...+ker(An−λnI),这其实就是将空间VVV分解成nnn个一维子空间的过程。
但是当方程det(A−λI)=0det(A-\lambda I)=0det(A−λI)=0有重根的时候,AAA的特征值就少于nnn个,假设此时AAA有rrr个互异的特征值,分解V=ker(A−λ1I)+...+ker(A−λrI)V=ker(A-\lambda_1 I)+...+ker(A-\lambda_r I)V=ker(A−λ1I)+...+ker(A−λrI)就可能会出问题,因为这些子空间维数的和有可能小于nnn。如果记特征值λi\lambda_iλi的代数重数为l(λi)l(\lambda_i)l(λi),一般条件下只有l(λi)≥dim (ker(A−λiI))l(\lambda_i) \ge dim\ (ker(A-\lambda_i I))l(λi)≥dim (ker(A−λiI)),二者相等时上面的分解才成立。
但是对任意一个矩阵BBB,很明显方程Bkx=0B^kx=0Bkx=0的解都是方程Bk+1x=0B^{k+1} x=0Bk+1x=0的解,即ker(Bk)⊂ker(Bk+1)ker(B^k) \subset ker(B^{k+1})ker(Bk)⊂ker(Bk+1)对任意正整数 kkk 成立。所以一个想法是,如果重根λi\lambda_iλi对应的ker(A−λiI)ker(A-\lambda_i I)ker(A−λiI)维数不够,那么能否用ker((A−λiI)k)ker((A-\lambda_i I)^k)ker((A−λiI)k)来代替。
当然了,想法虽然已经有了,但还需要两点条件:
- 一是存在某个kkk,使得ker((A−λiI)k)ker((A-\lambda_i I)^k)ker((A−λiI)k)的维数足够,即l(λi)=dim (ker((A−λiI)k))l(\lambda_i) =dim\ (ker((A-\lambda_i I)^k))l(λi)=dim (ker((A−λiI)k))。
- 二是ker((A−λiI)k)ker((A-\lambda_i I)^k)ker((A−λiI)k)得是矩阵AAA的不变子空间。
下面给出一些引理说明这两点条件确实是满足的。
2.一些引理
第二个条件更直观,也更容易证明,先放在前面。
引理2.1 ker((A−λiI)k)ker((A-\lambda_i I)^k)ker((A−λiI)k)是矩阵AAA的不变子空间。
证明:只需要注意到 (A−λiI)ku=0(A-\lambda_i I)^ku=0(A−λiI)ku=0 意味着 (A−λiI)kAu=A(A−λiI)ku=0(A-\lambda_i I)^k Au=A(A-\lambda_i I)^ku=0(A−λiI)kAu=A(A−λiI)ku=0,所以命题成立。
既然ker((A−λiI)k)ker((A-\lambda_i I)^k)ker((A−λiI)k)确实是不变子空间,现在就需要验证它的维数随着kkk“增加”,但是又不会超过l(λi)l(\lambda_i)l(λi)。
引理2.2 若λi\lambda_iλi为矩阵AAA的代数重数为lil_ili的特征值,那么dim{ker((A−λiI)li+k)}=lidim\{ker((A-\lambda_iI)^{l_i+k}) \}=l_idim{ker((A−λiI)li+k)}=li对任意非负kkk成立
这里要简单应用一下Schur分解,Schur分解是说:任意一个复数矩阵CCC都相似于一个上三角矩阵UUU,即T−1CT=UT^{-1}CT=UT−1CT=U,且UUU的对角元为矩阵CCC的特征值。
应用这个定理先将AAA分解为TUT−1TUT^{-1}TUT−1且UUU的对角元为diag(...,λi,...,λi)diag(...,\lambda_i,...,\lambda_i)diag(...,λi,...,λi),λi\lambda_iλi的个数为其代数重数lil_ili,于是 (A−λiI)k=T(U−λiI)kT−1(A−λ_iI)^k=T(U-\lambda_i I)^{k}T^{-1}(A−λiI)k=T(U−λiI)kT−1 且 ker(T(U−λiI)kT−1)=ker((U−λiI)k)ker(T(U-\lambda_i I)^{k}T^{-1})=ker((U-\lambda_i I)^{k})ker(T(U−λiI)kT−1)=ker((U−λiI)k)。再把矩阵U−λiIU-\lambda_i IU−λiI写成(CD00F)\left(\begin{array}{ll} C& D_0 \\ 0& F\end{array} \right)(C0D0F),其中FFF是一个严格上三角矩阵,FFF的阶数就是λi\lambda_iλi的代数重数lil_ili。
于是(U−λiI)k=(CkDk0Fk)(U-\lambda_i I)^{k}=\left(\begin{array}{ll} C^k& D_k \\ 0& F^k\end{array} \right)(U−λiI)k=(Ck0DkFk),注意到FkF^kFk严格上三角,所以Fli=0F^{l_i}=0Fli=0。另外再注意到CCC的对角元均不为0,所以CkC^kCk的对角元也都不为0。所以rank((U−λiI)k)=n−lirank((U-\lambda_i I)^{k})=n-l_irank((U−λiI)k)=n−li,于是ker((U−λiI)k)=liker((U-\lambda_i I)^{k})=l_iker((U−λiI)k)=li。
本文探讨了若尔当标准型的理解,分析了方阵对角化条件及过程,特别讨论了特征值重根情况下,如何通过增加幂次来获取足够的不变子空间,确保空间的完整分解。
4637

被折叠的 条评论
为什么被折叠?



