五、不能对角化的矩阵
假设 λ\lambdaλ 是 AAA 的一个特征值,我们从两个方面发现这个事实:
- 特征向量(几何的):Ax=λxA\boldsymbol x=\lambda\boldsymbol xAx=λx 有非零解。
- 特征值(代数的):A−λIA-\lambda IA−λI 的行列式为零。
数字 λ\lambdaλ 可能是一个单一的特征值也可能是重复的特征值,我们想要知道它的重复数(multiplicity)。大多数特征值的重复度 M=1M=1M=1(单一的特征值),有一条特征向量的直线,且 det(A−λI)\det(A-\lambda I)det(A−λI) 没有多重因子。
但是也有一些例外的矩阵,它的特征值可能重复(repeated),则有两种不同的方式来计算它的重复度,对于每一个 λ\lambdaλ 总是有 GM≤AM\textrm{GM}\leq \textrm{AM}GM≤AM:
- (几何重数 Geometric Multiplicity = GM)\color{blue}(几何重数\,\textrm{Geometric Multiplicity = GM})\kern 10pt(几何重数Geometric Multiplicity = GM)计算 λ\lambdaλ 对应的无关特征向量的个数。则 GM\textrm{GM}GM 就是 A−λIA-\lambda IA−λI 零空间的维度。
- (代数重数 Algebraic Multiplicity = AM)\color{blue}(代数重数\,\textrm{Algebraic Multiplicity = AM})\kern 10pt(代数重数Algebraic Multiplicity = AM)AM\textrm{AM}AM 计算的是 λ\lambdaλ 在特征值中的重复次数,检验 det(A−λI)=0\det(A-\lambda I)=0det(A−λI)=0 的 nnn 个根。
如果 AAA 有特征值 λ=4,4,4\lambda=4,4,4λ=4,4,4,则特征值有 AM=3\textrm{AM}=3AM=3,且 GM=1,2\textrm{GM} = 1,2GM=1,2 或 333。
下面的矩阵 AAA 是一个标准的麻烦例子,它的特征值 λ=0\lambda=0λ=0 是重复的,这是一个双重特征值(AM=2\textrm{AM}=2AM=2),但是只有一个特征向量 GM=1\textrm{GM}=1GM=1。AM=2GM=1A=[0100] 有 det(A−λI)=∣−λ10−λ∣=λ2λ=0,0 但是只有 1 个特征向量\begin{matrix}\pmb{\textrm{AM}=2}\\\pmb{\textrm{GM}=1}\end{matrix}\kern 15ptA=\begin{bmatrix}0&1\\0&0\end{bmatrix}\,有\,\det(A-\lambda I)=\begin{vmatrix}-\lambda&1\\0&-\lambda\end{vmatrix}=\lambda^2\kern 15pt\begin{matrix}\pmb{\lambda=0,0\,但是只}\\\pmb{有\,1\,个特征向量}\end{matrix}AM=2GM=1A=[0010]有det(A−λI)=−λ01−λ=λ2λ=0,0但是只有1个特征向量由于 λ2=0\lambda^2=0λ2=0 有双重根,所以理论上应该有两个特征向量,双重因子 λ2\lambda^2λ2 使得 AM=2\textrm{AM}=2AM=2,但是只有 111 个特征向量 x=(1,0)\boldsymbol x=(1,0)x=(1,0) 且 GM=1\textrm{GM}=1GM=1。当 GM\textrm{GM}GM 小于 AM\textrm{AM}AM 时,此时特征向量的不足使得 AAA 无法对角化。
下面的三个矩阵同样是特征向量不足,它们重复的特征值是 λ=5\lambda=5λ=5,迹是 101010 行列式是 252525:A=[5105]和A=[6−114]和A=[72−23]A=\begin{bmatrix}5&1\\0&5\end{bmatrix}\kern 5pt和\kern 5ptA=\begin{bmatrix}6&-1\\1&\kern 7pt4\end{bmatrix}\kern 5pt和\kern 5ptA=\begin{bmatrix}\kern 7pt7&2\\-2&3\end{bmatrix}A=[5015]和A=[61−14]和A=[7−223]这三个矩阵都有 det(A−λI)=(λ−5)2\det(A-\lambda I)=(\lambda-5)^2det(A−λI)=(λ−5)2,代数重数是 AM=2\textrm{AM}=2AM=2,但是每个 A−5IA-5IA−5I 的秩都为 111,所以几何重数是 GM=1\textrm{GM}=1GM=1。对应 λ=5\lambda=5λ=5 的只有一条特征向量的直线,这些矩阵都不能对角化。
六、哈密顿 - 凯莱定理(Cayley-Hamilton Theorem)
哈密顿 - 凯莱定理是说乘积 (A−λ1I)(A−λ2I)⋯(A−λnI)(A-\lambda_1 I)(A-\lambda_2I)\cdots(A-\lambda_nI)(A−λ1I)(A−λ2I)⋯(A−λnI) 是零矩阵。在多项式 p(λ)=det(A−λI)p(\lambda)=\det(A-\lambda I)p(λ)=det(A−λI) 中将数字 λ\lambdaλ 替换成了矩阵 AAA,乘积 p(A)p(A)p(A) 总是零矩阵,当 AAA 不能对角化时仍然成立。
证明:当 AAA 可以对角化时,矩阵 A−λjI=X(Λ−λjI)X−1A-\lambda_jI=X(\Lambda-\lambda_jI)X^{-1}A−λjI=X(Λ−λjI)X−1 中的 Λ−λjI\Lambda-\lambda_jIΛ−λjI 的第 j,jj,jj,j 对角线上的元素为零。则 p(A)=(A−λ1I)(A−λ2I)⋯(A−λnI)=X(Λ−λ1I)X−1X(Λ−λ2I)X−1⋯X(Λ−λnI)X−1=X(Λ−λ1I)(Λ−λ2I)⋯(Λ−λnI)X−1\begin{array}{l}p(A)=(A-\lambda_1I)(A-\lambda_2I)\cdots(A-\lambda_nI)\\\kern 23pt=X(\Lambda-\lambda_1I)X^{-1}X(\Lambda-\lambda_2I)X^{-1}\cdots X(\Lambda-\lambda_nI)X^{-1}\\\kern 23pt=X(\Lambda-\lambda_1I)(\Lambda-\lambda_2I)\cdots(\Lambda-\lambda_nI)X^{-1}\end{array}p(A)=(A−λ1I)(A−λ2I)⋯(A−λnI)=X(Λ−λ1I)X−1X(Λ−λ2I)X−1⋯X(Λ−λnI)X−1=X(Λ−λ1I)(Λ−λ2I)⋯(Λ−λnI)X−1这个乘积就是零矩阵,因为中间的对角矩阵在每个对角线的位置上都有一个零,则有 p(A)=零矩阵p(A)=零矩阵p(A)=零矩阵。
当 AAA 不能对角化时,可以用一系列可对角化的矩阵来近似 AAA。
七、AB 和 BA 的特征值
若 AAA 是 m×nm\times nm×n 的矩阵,BBB 是 n×mn\times mn×m 的矩阵,则 ABABAB 和 BABABA 有相同的非零特征值。
证明:如下面两个方阵相乘,其中第一个和第三个矩阵互为逆矩阵,后面的大小是每个方块矩阵的形状。[I−A0I][AB0B0][IA0I]=[00BBA][m×mm×nn×mn×n]\begin{bmatrix}I&-A\\0&I\end{bmatrix}\begin{bmatrix}AB&0\\B&0\end{bmatrix}\begin{bmatrix}I&A\\0&I\end{bmatrix}=\begin{bmatrix}0&0\\B&BA\end{bmatrix}\kern 15pt\begin{bmatrix}m\times m&m\times n\\n\times m&n\times n\end{bmatrix}[I0−AI][ABB00][I0AI]=[0B0BA][m×mn×mm×nn×n]上式 D−1ED=FD^{-1}ED=FD−1ED=F 表明 FFF 和 EEE 相似 —— 它们有相同的 m+nm+nm+n 个特征值。E=[AB0B0] 有AB 中的 m 个特征值,加上 n 个零F=[00BBA] 有 BA 中的 n 个特征值,加上 m 个零\begin{array}{ll}E=\begin{bmatrix}AB&0\\B&0\end{bmatrix}\,有AB\,中的\,m\,个特征值,加上\,n\,个零\\F=\begin{bmatrix}0&0\\B&BA\end{bmatrix}\,有\,BA\,中的\,n\,个特征值,加上\,m\,个零\end{array}E=[ABB00]有AB中的m个特征值,加上n个零F=[0B0BA]有BA中的n个特征值,加上m个零所以 ABABAB 和 BABABA 除了 ∣n−m∣|n-m|∣n−m∣ 个零外,它们有相同的特征值。
如果 A=[11]A=\begin{bmatrix}1&1\end{bmatrix}A=[11],B=ATB=A^TB=AT,则 ATA=[1111]A^TA=\begin{bmatrix}1&1\\1&1\end{bmatrix}ATA=[1111] 的特征值是 λ=2\lambda=2λ=2 和 000,ATA=[2]A^TA=\begin{bmatrix}2\end{bmatrix}ATA=[2] 的特征值为 222。
八、主要内容总结
- 如果 AAA 有 nnn 个无关的特征向量 x1,x2,⋯ ,xn\boldsymbol x_1,\boldsymbol x_2,\cdots,\boldsymbol x_nx1,x2,⋯,xn,它们进入到 XXX 的列。A 被 X 对角化X−1AX=Λ和A=XΛX−1\pmb{A\,被\,X\,对角化}\kern 15ptX^{-1}AX=\Lambda\kern 5pt和\kern 5ptA=X\Lambda X^{-1}A被X对角化X−1AX=Λ和A=XΛX−1
- AAA 的幂是 Ak=XΛkX−1A^k=X\Lambda^kX^{-1}Ak=XΛkX−1,在 XXX 中的特征向量不变。
- AkA^kAk 的特征值是矩阵 Λk\Lambda^kΛk 中的 (λ1)k,(λ2)k,⋯ ,(λn)k(\lambda_1)^k,(\lambda_2)^k,\cdots,(\lambda_n)^k(λ1)k,(λ2)k,⋯,(λn)k。
- uk+1=Auk\boldsymbol u_{k+1}=A\boldsymbol u_kuk+1=Auk 从 u0\boldsymbol u_0u0 开始的解是 uk=Aku0=XΛkX−1u0\boldsymbol u_k=A^k\boldsymbol u_0=X\Lambda^kX^{-1}\boldsymbol u_0uk=Aku0=XΛkX−1u0:
由 u0=c1x1+c2x2+⋯+cnxn 得到 uk=c1(λ1)kx1+c2(λ2)kx2+⋯+cn(λn)kxn由\,{\color{blue}\boldsymbol u_0=c_1\boldsymbol x_1+c_2\boldsymbol x_2+\cdots+c_n\boldsymbol x_n}\,得到\,\color{blue}\boldsymbol u_k=c_1(\lambda_1)^k\boldsymbol x_1+c_2(\lambda_2)^k\boldsymbol x_2+\cdots+c_n(\lambda_n)^k\boldsymbol x_n由u0=c1x1+c2x2+⋯+cnxn得到uk=c1(λ1)kx1+c2(λ2)kx2+⋯+cn(λn)kxn这展示了步骤 1,2,31,2,31,2,3,其中 c′sc'sc′s 来自于 X−1u0X^{-1}\boldsymbol u_0X−1u0,λk\lambda^kλk 来自 Λk\Lambda^kΛk,x′s\boldsymbol x'sx′s 来自 XXX。 - 如果 AAA 的每个特征值都有足够的特征向量(GM = AM\textrm{GM = AM}GM = AM),则 AAA 可以对角化。
九、例题
【例4】卢卡斯数字(Lucas numbers)除了从 L1=1L_1=1L1=1 和 L2=3L_2=3L2=3 开始之外,其它和斐波那契数一样。它们是同样的规则 Lk+2=Lk+1+LkL_{k+2}=L_{k+1}+L_kLk+2=Lk+1+Lk,后面的卢卡斯数字是 4,7,11,184,7,11,184,7,11,18。证明卢卡斯数字 L100=λ1100+λ2100L_{100}=\lambda_1^{100}+\lambda_2^{100}L100=λ1100+λ2100。
解: 和斐波那契数相同,也有 uk+1=[1110]uk\boldsymbol u_{k+1}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\boldsymbol u_kuk+1=[1110]uk,因为 Lk+2=Lk+1+LkL_{k+2}=L_{k+1}+L_kLk+2=Lk+1+Lk 是同样的规则(只是不同的起始值),这个方程变成了 2×22\times22×2 的系统:
令 uk=[Lk+1Lk]\color{blue}\boldsymbol u_k=\begin{bmatrix}L_{k+1}\\\\L_k\end{bmatrix}uk=Lk+1Lk,规则 Lk+2=Lk+1+LkLk+1=Lk+1\begin{array}{l}L_{k+2}=L_{k+1}+L_k\\L_{k+1}=L_{k+1}\end{array}Lk+2=Lk+1+LkLk+1=Lk+1 是 uk+1=[1110]uk\color{blue}\boldsymbol u_{k+1}=\begin{bmatrix}1&1\\\\1&0\end{bmatrix}\boldsymbol u_kuk+1=1110uk
A=[1110]A=\begin{bmatrix}1&1\\1&0\end{bmatrix}A=[1110] 的特征向量和特征值仍然由 λ2=λ+1\lambda^2=\lambda+1λ2=λ+1 得来:λ1=1+52 和 x1=[λ11]λ2=1−52和x2=[λ21]\lambda_1=\frac{1+\sqrt5}{2}\,和\,\boldsymbol x_1=\begin{bmatrix}\lambda_1\\1\end{bmatrix}\kern 15pt\lambda_2=\frac{1-\sqrt5}{2}\kern 5pt和\kern 5pt\boldsymbol x_2=\begin{bmatrix}\lambda_2\\1\end{bmatrix}λ1=21+5和x1=[λ11]λ2=21−5和x2=[λ21]现在求解 c1x1+c2x2=u1=(3,1)c_1\boldsymbol x_1+c_2\boldsymbol x_2=\boldsymbol u_1=(3,1)c1x1+c2x2=u1=(3,1),解是 c1=λ1c_1=\lambda_1c1=λ1 和 c2=λ2c_2=\lambda_2c2=λ2。检验:λ1x1+λ2x2=[λ12+λ22λ1+λ2]=[A2 的迹A 的迹]=[31]=u1\lambda_1\boldsymbol x_1+\lambda_2\boldsymbol x_2=\begin{bmatrix}\lambda_1^2+\lambda^2_2\\\lambda_1+\lambda_2\end{bmatrix}=\begin{bmatrix}A^2\,的迹\\A\,的迹\end{bmatrix}=\begin{bmatrix}3\\1\end{bmatrix}=\boldsymbol u_1λ1x1+λ2x2=[λ12+λ22λ1+λ2]=[A2的迹A的迹]=[31]=u1由 u100=A99u1\boldsymbol u_{100}=A^{99}\boldsymbol u_1u100=A99u1 我们可以得到卢卡斯数 (L101,L100)(L_{101},L_{100})(L101,L100),特征向量 x1\boldsymbol x_1x1 和 x2\boldsymbol x_2x2 的第二个分量都是 111,所以 u100\boldsymbol u_{100}u100 的第二个分量是:卢卡斯数字L100=c1λ199+c2λ299=λ1100+λ2100\boxed{\pmb{卢卡斯数字}\kern 20pt\pmb{L_{100}}=c_1\lambda_1^{99}+c_2\lambda_2^{99}=\pmb{\lambda_1^{100}+\lambda_2^{100}}}卢卡斯数字L100=c1λ199+c2λ299=λ1100+λ2100卢卡斯数字比斐波那契数开始的要快,最终也要大约 5\sqrt55 倍。
【例5】求矩阵 AAA 的逆矩阵、特征值和行列式:A=5∗eye(4)−ones(4)=[4−1−1−1−14−1−1−1−14−1−1−1−14]A=5*\textrm{\pmb{eye}}(4)-\textrm{\pmb{ones}}(4)=\begin{bmatrix}\kern 7pt4&-1&-1&-1\\-1&\kern 7pt4&-1&-1\\-1&-1&\kern 7pt4&-1\\-1&-1&-1&\kern 7pt4\end{bmatrix}A=5∗eye(4)−ones(4)=4−1−1−1−14−1−1−1−14−1−1−1−14描述一个特征向量矩阵 XXX,使 X−1AX=ΛX^{-1}AX=\LambdaX−1AX=Λ。
解: 全 111 矩阵的特征值是什么?它的秩为 111,所以三个特征值是 λ=0,0,0\lambda=0,0,0λ=0,0,0,迹是 444,所以另一个特征值是 λ=4\lambda=4λ=4,从 5I5I5I 减去全 111 矩阵得到矩阵 AAA:从 5,5,5,5 减去特征值 4,0,0,0 得到 A 的特征值为 1,5,5,5。\color{blue}从\,5,5,5,5\,减去特征值\,4,0,0,0 \,得到\,A\, 的特征值为\,1,5,5,5。从5,5,5,5减去特征值4,0,0,0得到A的特征值为1,5,5,5。AAA 的行列式是四个特征值的乘积,即是 125125125。λ=1\lambda=1λ=1 对应的特征向量是 x=(1,1,1,1)\boldsymbol x=(1,1,1,1)x=(1,1,1,1) 或 (c,c,c,c)(c,c,c,c)(c,c,c,c),由于 AAA 是对称矩阵,所以其它的特征向量都垂直于 x\boldsymbol xx。最漂亮的特征向量矩阵 XXX 是对称的正交哈达玛矩阵(Hadamard matrix) HHH 乘上 12\displaystyle\frac{1}{2}21 得到单位列向量。标准正交特征向量X=H=12[11111−11−111−1−11−1−11]=HT=H−1\pmb{标准正交特征向量}\kern 10ptX=H=\frac{1}{2}\begin{bmatrix}1&\kern 7pt1&\kern 7pt1&\kern 7pt1\\1&-1&\kern 7pt1&-1\\1&\kern 7pt1&-1&-1\\1&-1&-1&\kern 7pt1\end{bmatrix}=H^T=H^{-1}标准正交特征向量X=H=2111111−11−111−1−11−1−11=HT=H−1A−1A^{-1}A−1 的特征值是 1,15,15,151,\displaystyle\frac{1}{5},\frac{1}{5},\frac{1}{5}1,51,51,51,特征向量不变,所以 A−1=HΛ−1H−1A^{-1}=H\Lambda^{-1}H^{-1}A−1=HΛ−1H−1,逆矩阵惊人的简洁:A−1=15∗(eye(4)+ones(4))=15[2111121111211112]A^{-1}=\frac{1}{5}*(\pmb{\textrm{eye}}(4)+\pmb{\textrm{ones}}(4))=\frac{1}{5}\begin{bmatrix}2&1&1&1\\1&2&1&1\\1&1&2&1\\1&1&1&2\end{bmatrix}A−1=51∗(eye(4)+ones(4))=512111121111211112AAA 是由 5I5I5I 变化来的秩一矩阵,所以 A−1A^{-1}A−1 是由 I/5I/5I/5 变化来的秩一矩阵。
在一个有 555 个节点的图中,行列式 125125125 是生成树(spanning trees,接触所有的节点)的个数,树没有回路。
如果有 666 个节点,矩阵 6∗eye(5)−ones(5)6*\pmb{\textrm{eye}}(5)-\pmb{\textrm{ones}}(5)6∗eye(5)−ones(5) 有 555 个特征值 1,6,6,6,61,6,6,6,61,6,6,6,6。