七、矩阵的指数
我们想要将解 u ( t ) \boldsymbol u(t) u(t) 写成一种新的形式 e A t u ( 0 ) e^{At}\boldsymbol u(0) eAtu(0)。 首先要说明的是矩阵作为指数 e A t e^{At} eAt 是什么意思?定义矩阵 e A t e^{At} eAt 和数字 e x e^x ex 一样。
e x e^x ex 直接的定义是无穷级数 1 + x + 1 2 x 2 + 1 6 x 3 + ⋯ 1+x+\displaystyle\frac{1}{2}x^2+\frac{1}{6}x^3+\cdots 1+x+21x2+61x3+⋯,将 x x x 改成方形矩阵 A t At At,就得到矩阵指数 e A t e^{At} eAt 的定义:
矩阵指数 e A t e A t = I + A t + 1 2 ( A t ) 2 + 1 6 ( A t ) 3 + ⋯ ( 6.3.14 ) 它对 t 的导数是 A e A t A + A 2 t + 1 2 A 3 t 2 + ⋯ = A e A t 它的特征值是 e λ t ( I + A t + 1 2 ( A t ) 2 + ⋯ ) x = ( 1 + λ t + 1 2 ( λ t ) 2 + ⋯ ) x \begin{array}{l}\pmb{矩阵指数\,e^{At}}&{\color{blue}e^{At}=I+At+\displaystyle\frac{1}{2}(At)^2+\frac{1}{6}(At)^3+\cdots}\kern 10pt(6.3.14)\\\pmb{它对\,t\,的导数是\,Ae^{At}}&A+A^2t+\displaystyle\frac{1}{2}A^3t^2+\cdots=\color{blue}Ae^{At}\\\pmb{它的特征值是\,e^{\lambda t}}&(I+At+\displaystyle\frac{1}{2}(At)^2+\cdots)\boldsymbol x=\color{blue}(1+\lambda t+\frac{1}{2}(\lambda t)^2+\cdots)\boldsymbol x\end{array} 矩阵指数eAt它对t的导数是AeAt它的特征值是eλteAt=I+At+21(At)2+61(At)3+⋯(6.3.14)A+A2t+21A3t2+⋯=AeAt(I+At+21(At)2+⋯)x=(1+λt+21(λt)2+⋯)x
( A t ) n (At)^n (At)n 除以的数字是 " n n n 的阶乘 ", n ! = ( 1 ) ( 2 ) ⋯ ( n − 1 ) ( n ) n!=(1)(2)\cdots(n-1)(n) n!=(1)(2)⋯(n−1)(n), 1 , 2 , 6 1,2,6 1,2,6 后面的阶乘是 4 ! = 24 4!=24 4!=24 和 5 ! = 120 5!=120 5!=120,增长的很快。这个级数总是收敛且它的导数永远是 A e A t Ae^{At} AeAt。因此 e A t u ( 0 ) e^{At}\boldsymbol u(0) eAtu(0) 是微分方程解的一个快速的公式 —— 甚至是当它缺少特征向量的情况。
例 4 4 4 中会使用到这个级数,表明它在缺少特征向量时仍然适用,此时会得到 t e λ t te^{\lambda t} teλt。下面先说明正常情况下(可对角化)如何得到 X e Λ t X − 1 Xe^{\Lambda t}X^{-1} XeΛtX−1。
本章的重点是如何通过对角化得到 u ( t ) = e A t u ( 0 ) \boldsymbol u(t)=e^{At}\boldsymbol u(0) u(t)=eAtu(0)。假设 A A A 有 n n n 个无关的特征向量,则它可以对角化。将 A = X Λ X − 1 A=X\Lambda X^{-1} A=XΛX−1 代入到 e A t e^{At} eAt 的级数中,当出现 X Λ X − 1 X Λ X − 1 X\Lambda X^{-1}X\Lambda X^{-1} XΛX−1XΛX−1 出现时,中间的 X − 1 X X^{-1}X X−1X 可以消去: 使用级数 e A t = I + X Λ X − 1 t + 1 2 ( X Λ X − 1 t ) ( X Λ X − 1 t ) + ⋯ 提出因子 X 和 X − 1 = X [ 1 + Λ t + 1 2 ( Λ t ) 2 + ⋯ ] X − 1 ( 6.3.15 ) e A t 完成了对角化 e A t = X e Λ t X − 1 \begin{array}{ll}\pmb{使用级数}&\pmb{e^{At}}=I+X\Lambda X^{-1}t+\displaystyle\frac{1}{2}(X\Lambda X^{-1}t)(X\Lambda X^{-1}t)+\cdots\\\pmb{提出因子\,X\,和\,X^{-1}}&\kern 16pt=X[1+\Lambda t+\displaystyle\frac{1}{2}(\Lambda t)^2+\cdots]X^{-1}\kern 80pt(6.3.15)\\e^{At}\,\pmb{完成了对角化}&\boxed{\color{blue}e^{At}=Xe^{\Lambda t}X^{-1}}\end{array} 使用级数提出因子X和X−1eAt完成了对角化eAt=I+XΛX−1t+21(XΛX−1t)(XΛX−1t)+⋯=X[1+Λt+21(Λt)2+⋯]X−1(6.3.15)eAt=XeΛtX−1 e A t e^{At} eAt 和 A A A 有相同的特征值向量矩阵 X X X,而 Λ \Lambda Λ 是对角矩阵,所以 e Λ t e^{\Lambda t} eΛt 也是对角矩阵。对角线上的数字是 e λ i t e^{\lambda_it} eλit,乘积 X e Λ t X − 1 u ( 0 ) Xe^{\Lambda t}X^{-1}\boldsymbol u(0) XeΛtX−1u(0) 即得到 u ( t ) \boldsymbol u(t) u(t): e A t u ( 0 ) = X e Λ t X − 1 u ( 0 ) = [ x 1 ⋯ x n ] [ e λ 1 t ⋱ e λ n t ] [ c 1 ⋮ c n ] ( 6.3.16 ) e^{At}\boldsymbol u(0)=Xe^{\Lambda t}X^{-1}\boldsymbol u(0)=\begin{bmatrix}\\\boldsymbol x_1&\cdots&\boldsymbol x_n\\\,\end{bmatrix}\begin{bmatrix}e^{\lambda_1t}\\&\ddots\\&&e^{\lambda_nt}\end{bmatrix}\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}\kern 10pt(6.3.16) eAtu(0)=XeΛtX−1u(0)=
x1⋯xn
eλ1t⋱eλnt
c1⋮cn
(6.3.16)解 e A t u ( 0 ) e^{At}\boldsymbol u(0) eAtu(0) 与由三个步骤得来的答案式(6.3.6)一样: 1. u ( 0 ) = c 1 x 1 + c 2 x 2 + ⋯ + c n x n ,这一步需要 n 个无关的特征向量。 2. 每一个 x i 左边乘上它的成长因子 e λ i t ,随着时间按成长因子增长。 3. e A t u ( 0 ) 最好的形式是 u ( t ) = c 1 e λ 1 t x 1 + c 2 e λ 2 t x 2 + ⋯ + c n e λ n t x n ( 6.3.17 ) \boxed{\begin{array}{l}1.\,\boldsymbol u(0)=c_1\boldsymbol x_1+c_2\boldsymbol x_2+\cdots+c_n\boldsymbol x_n,这一步需要\,n\,个无关的特征向量。\\2.\,每一个\,\boldsymbol x_i\,左边乘上它的成长因子\,e^{\lambda_it},随着时间按成长因子增长。\\3.\,e^{At}\boldsymbol u(0)\,最好的形式是\kern 5pt\boldsymbol u(t)=c_1e^{\lambda_1t}\boldsymbol x_1+c_2e^{\lambda_2t}\boldsymbol x_2+\cdots+c_ne^{\lambda_nt}\boldsymbol x_n\kern 15pt(6.3.17)\end{array}} 1.u(0)=c1x1+c2x2+⋯+cnxn,这一步需要n个无关的特征向量。2.每一个xi左边乘上它的成长因子eλit,随着时间按成长因子增长。3.eAtu(0)最好的形式是u(t)=c1eλ1tx1+c2eλ2tx2+⋯+cneλntxn(6.3.17)【例4】当将 e λ t e^{\lambda t} eλt 代入到 y ′ ′ − 2 y ′ + y = 0 y''-2y'+y=0 y′′−2y′+y=0 时,则会得到一个有重根(repeated roots)的方程: λ 2 − 2 λ + 1 = 0 \lambda^2-2\lambda+1=0 λ2−2λ+1=0 就是 ( λ − 1 ) 2 = 0 (\lambda-1)^2=0 (λ−1)2=0,根 λ = 1 , 1 \pmb{\lambda=1,1} λ=1,1。在微积分求解微分方程时会用 e t e^t et 和 t e t te^t tet 作为两个无关解,这里探讨一下原因:
线性代数将 y ′ ′ − 2 y ′ + y = 0 y''-2y'+y=0 y