线性代数学习笔记7-3:特征值的应用——解微分方程、矩阵的指数函数

本文介绍了一阶导数常系数微分方程的解法,重点在于使用特征值分解的方法来简化问题,将其转化为指数函数的形式。通过具体实例说明了如何找到微分方程的通解,并探讨了稳态的概念。

之前介绍了求解一阶差分方程,本文介绍求解一阶导数常系数微分方程

常系数微分方程的解是指数形式的eλte^{\lambda t}eλt,基于这个事实,我们得以将问题转为线性代数的问题,求解其指数和系数
另外,在微分方程中将会看到特征值的另一应用:除了可以帮助我们求矩阵的幂,还可以求矩阵的指数

举例:一阶微分方程

对于一阶微分方程{du1dt=−u1+2u2du2dt=u1−2u2\left\{\begin{matrix}\frac{d u_{1}}{d t} &=-u_{1}+2 u_{2} \\\frac{d u_{2}}{d t} &=u_{1}-2 u_{2} \\\end{matrix}\right.{dtdu1dtdu2=u1+2u2=u12u2,初始条件为u1=1,u2=0u_1=1,u_2=0u1=1,u2=0

类比之前的差分方程,微分方程可以表示为一个方程组(未知量组成一个整体的列向量u\boldsymbol uu,系数为A\mathbf AAdudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au其中A=[−121−2],u(0)=[10]\boldsymbol{A}=\left[\begin{array}{cc}-1 & 2 \\1 & -2\end{array}\right], \quad \mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]A=[1122],u(0)=[10]
我们的最终目标是找到u(t)u(t)u(t),或者说追踪uuu随时间的变化及最终的值

[结论] 方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au的通解形式为u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t}) =c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2

  • 其中,特征向量λi\lambda_iλi和特征值xi\mathbf{x}_ixi来自特征值分解A=XΛX−1\boldsymbol{A} =\boldsymbol{X} \boldsymbol{\Lambda} \boldsymbol{X}^{-1}A=XΛX1
    系数cic_ici由初值条件给出(一旦确定后系数恒定不变),本质就是通过特征向量的线性组合表示初始状态的组合系数,即Xc=u(0)\mathbf X\boldsymbol c=\boldsymbol u(0)Xc=u(0)
  • 注意,之前讲的差分方程中,出现纯幂形式c1λ1kx1+c2λ2kx2+...c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}+...c1λ1kx1+c2λ2kx2+...
  • 而微分方程中出现纯指数形式c1eλ1tx1+c2eλ2tx2+...c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}+...c1eλ1tx1+c2eλ2tx2+...,两者作用类似
    例如将特解c1eλ1tx1c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}c1eλ1tx1代入方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au中验证:得到c1λ1eλ1tx1=Au=c1Aeλ1tx1c_{1} \lambda_{1}e^{\lambda_{1} t} \mathbf{x}_{1}=\boldsymbol{A} \mathbf{u}=c_{1} \boldsymbol{A}e^{\lambda_{1} t} \mathbf{x}_{1}c1λ1eλ1tx1=Au=c1Aeλ1tx1,即λ1x1=Ax1\lambda_{1} \mathbf{x}_{1}=\mathbf A\mathbf{x}_{1}λ1x1=Ax1,可见,这里纯指数主要是用于保证“微分后形式仍保持不变”

证明:方程的通解u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t}) =c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2 / 探究为何微分方程中出现指数函数
微分方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au中的dudt\frac{d \mathbf{u}}{d t}dtdu,就相当于差分方程中前后两项之差uk+1−uk\mathbf u _{k+1}-\mathbf u _{k}uk+1uk,只不过两项的距离无限小;
或者说,从u(0)u(0)u(0)u(t)u(t)u(t)认为经历了N→∞N\rightarrow \inftyN个差分方程,每个方程对应了时长为Δt/N\Delta_t/NΔt/N的小时隙
那么,将某个时刻的值u(t)∣t=kΔtu(t)|_{t=k\Delta_t}u(t)t=kΔt记为uku_kuk,则微分方程可以暂时视为dudt=uk+1−ukΔt=uk+1−ukt/N=Auk\frac{d \mathbf{u}}{d t} =\frac{\mathbf{u}_{k+1}-\mathbf{u}_{k}}{\Delta t}=\frac{\mathbf{u}_{k+1}-\mathbf{u}_{k}}{t / N}=\boldsymbol{A} \mathbf{u}_{k}dtdu=Δtuk+1uk=t/Nuk+1uk=Auk
改写得到uk+1=(tNA+1)uk\mathbf{u}_{k+1}=\left(\frac{t}{N} \boldsymbol{A}+1\right) \mathbf{u}_{k}uk+1=(NtA+1)uk这是上一节所学的内容,可以知道最终的值u(t)\mathbf{u}(\mathrm{t})u(t),等价于差分方程的最终值uN\mathbf{u}_NuNu(t)=uN=c1(tNλ1+1)Nx1+c2(tNλ2+1)Nx2\mathbf{u}(t)=\mathbf{u}_{N}=c_{1}\left(\frac{t}{N} \lambda_{1}+1\right)^{N} \mathbf{x}_{1}+c_{2}\left(\frac{t}{N} \lambda_{2}+1\right)^{N} \mathbf{x}_{2}u(t)=uN=c1(Ntλ1+1)Nx1+c2(Ntλ2+1)Nx2,并且考虑到lim⁡k→∞(1k+1)k→e\lim _{k \rightarrow \infty}\left(\frac{1}{k}+1\right)^{k} \rightarrow elimk(k1+1)ke,从差分变为微分,得到其通解形式u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2

求解dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au,其中A=[−121−2],u(0)=[10]\boldsymbol{A}=\left[\begin{array}{cc}-1 & 2 \\1 & -2\end{array}\right], \quad \mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]A=[1122],u(0)=[10]

  • 首先求A\boldsymbol{A}A的特征值:λ1=0,x1=[21]\lambda_{1}=0,\mathbf{x} 1=\left[\begin{array}{l}2 \\1\end{array}\right]λ1=0,x1=[21]λ1=−3,x1=[1−1]\lambda_{1}=-3,\mathbf{x} 1=\left[\begin{array}{l}1\\-1\end{array}\right]λ1=3,x1=[11]
  • 初始状态表示为特征向量的线性组合,也就是求解Xc=u(0)\mathbf X\boldsymbol c=\boldsymbol u(0)Xc=u(0)u(0)=[10]=c1[21]+c2[1−1],其中c 1=c2=1/3\mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]=c_{1}\left[\begin{array}{l}2 \\1\end{array}\right]+c_{2}\left[\begin{array}{c}1 \\-1\end{array}\right] \text {,其中c } 1=\mathrm{c} 2=1 / 3 u(0)=[10]=c1[21]+c2[11],其中1=c2=1/3
  • 根据上述的通解u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2,代入系数ccc和特征值λ\lambdaλ、特征向量x\mathbf{x}x解得u(t)=c1eλ1tx1+c2eλ2tx2=c1e0[21]+c2e−3t[1−1]=13[21]+13e−3t[1−1]\begin{array}{l} \mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2} \\=c_{1} e^{0}\left[\begin{array}{l}2 \\1\end{array}\right] +c_{2} e^{-3 t}\left[\begin{array}{c}1 \\-1\end{array}\right] \\=\frac{1}{3}\left[\begin{array}{l}2 \\1\end{array}\right]+\frac{1}{3} e^{-3 t}\left[\begin{array}{c}1 \\-1\end{array}\right] \end{array}u(t)=c1eλ1tx1+c2eλ2tx2=c1e0[21]+c2e3t[11]=31[21]+31e3t[11]

分析:随着ttt的增大,答案中第二项会消失,而第一项为稳态(当有0特征值时,就出现稳态SteadyState)’
如果初态u(0)=[10]\mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]u(0)=[10],那么最终的稳态就是u(t)∣t=∞=13[21]\begin{array}{l} \mathbf{u}(\mathrm{t})|_{t=\infty}=\frac{1}{3}\left[\begin{array}{l}2 \\1\end{array}\right]\end{array}u(t)t==31[21]


关于“稳态”:

对于通解u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2
矩阵的特征值给出了u(t)\mathbf{u}(\mathrm{t})u(t)的发展趋势(稳定性):

  • eλ1te^{\lambda_{1} t}eλ1t视为AejϕAe^{j\phi}Aejϕ的形式,实部Re{λ}Re\{\lambda\}Re{λ}决定了稳定性(即决定幅值的增长速度,因为∣ea+jb∣=∣ea∣∣ejb∣=∣ea∣|e^{a+jb}|=|e^{a}||e^{jb}|=|e^{a}|ea+jb=eaejb=ea),虚部Im{λ}Im\{\lambda\}Im{λ}对应了单位圆上的相位旋转

  • Re{λ}>0Re\{\lambda\}>0Re{λ}>0,对应项发散;Re{λ}=0Re\{\lambda\}=0Re{λ}=0,对应项幅值稳定不变;Re{λ}<0Re\{\lambda\}<0Re{λ}<0,对应项消失(t→∞时u(t)→0t\rightarrow \infty 时\mathbf{u}(\mathrm{t})\rightarrow 0tu(t)0

对比复习:
①之前的矩阵的幂的情况
如果其所有特征值∣λi∣<1|\lambda_i|<1λi<1,则k→∞时Ak→0k\rightarrow \infty时\boldsymbol{A}^k\rightarrow 0kAk0(因为Λk→0\boldsymbol{\Lambda}^k\rightarrow 0Λk0,故Ak=SΛkS−1→0\boldsymbol{A}^k=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}\rightarrow 0Ak=SΛkS10
之前的差分方程的稳态情况(主要取决于幅值∣λi∣|\lambda_i|λi
对于实数特征值,特征值∣λi∣<1|\lambda_i|<1λi<1的项最终会消失,特征值∣λi∣=1|\lambda_i|=1λi=1的项恒定,特征值∣λi∣>1|\lambda_i|>1λi>1的项最终不断增长
对于复数特征值,虚部引入了复平面上的“旋转”,故特征值的幅值仍然确定稳态,而相位则对应了每次做矩阵乘法时特征向量的旋转角度

  • 综合考虑所有特征值对于解的稳态的影响:
    ①若所有Re{λ}≤0Re\{\lambda\}\leq0Re{λ}0(对应项消失/幅值稳定不变),则可以进入稳态
    ②一旦存在Re{λ}>0Re\{\lambda\}>0Re{λ}>0,则发散

另外,我们比较关注二阶系统的稳定性,一个推论是:

  • 假如行列式det(A)>0det(\mathbf A)>0det(A)>0trace(A)<0trace(\mathbf A)<0trace(A)<0(这等价于说二阶矩阵有两个实部为负的特征值),则微分方程的解可以进入稳态

扩展:从方程解耦(特征值分解)的角度求解微分方程

下文一切讨论的前提A\mathbf AA的特征向量矩阵S\mathbf SS可逆/A\mathbf AA有n个无关的特征向量,因为此时才能保证可对角化(从而用于解耦的特征向量数量是足够的
将矩阵对角化(特征值分解)为A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}A=SΛS1

下面从另一角度考虑一般的一阶微分方程求解原理探究为什么一阶微分方程的解是指数函数eλte^{\lambda t}eλt的和的形式之前已经证明,这里从另一角度理解);

出发角度是:
将问题转换到另一坐标系(基向量为特征向量),从而解耦方程,得到解,再转换回原坐标系;
具体的解耦方法
对于未知量相互耦合的方程组,用特征值和特征向量来对角化方程的系数矩阵,可以实现解耦(各未知量没有关系)

关于变量的耦合与解耦
对于一阶微分方程{du1dt=−u1+2u2du2dt=u1−2u2\left\{\begin{matrix}\frac{d u_{1}}{d t} &=-u_{1}+2 u_{2} \\\frac{d u_{2}}{d t} &=u_{1}-2 u_{2} \\\end{matrix}\right.{dtdu1dtdu2=u1+2u2=u12u2,也就是dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au

  • 原方程有两个相互耦合(coupled)的未知函数u1,u2u_1,u_2u1,u2
  • 找出A\boldsymbol{A}A的特征值和特征向量(即对角化),可以实现解耦,即将方程组每一行变为可以独立求解的单个方程,他们之间互不相干
    实际上后面会看到,解耦的两个方程的解就对应了 最终通解的两个分量u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2

进一步的,下面研究如何将解表示为特征值矩阵Λ\mathbf \LambdaΛ和特征向量矩阵S\mathbf SS的形式

对于dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au方程,原方程未知数u1,u2u_1,u_2u1,u2耦合,即A\boldsymbol{A}A不是对角阵
希望解耦,就是说希望将A\boldsymbol{A}A对角化A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}A=SΛS1(出现对角的系数矩阵意味着各未知数互不干扰),方法是:

  • u\mathbf{u}u写为特征向量的线性组合形式u=Sv\mathbf{u}=\mathbf{S v}u=Sv
    其中v\mathbf{v}v新的未知量(代替原来的未知量u\mathbf{u}uS\mathbf SS矩阵是A\boldsymbol{A}A的特征向量矩阵

  • u=Sv\mathbf{u}=\mathbf{S v}u=Sv带入原方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au,得到Sdvdt=ASv⇒dvdt=S−1ASv=Λv\begin{array}{l}\boldsymbol{S} \frac{d \mathbf{v}}{d t}=\boldsymbol{A} \boldsymbol{S} \mathbf{v} \\\Rightarrow \frac{d \mathbf{v}}{d t}=\boldsymbol{S}^{-1} \boldsymbol{A} \boldsymbol{S} \mathbf{v}=\boldsymbol{\Lambda} \mathbf{v}\end{array}Sdtdv=ASvdtdv=S1ASv=Λv

可以理解为:

  • 以特征向量为坐标系的基,求解问题(带入u=Sv\mathbf{u}=\mathbf{S v}u=Sv,原未知量u\mathbf{u}u在新的基下的坐标为v\mathbf{v}v,即新的未知量为v\mathbf{v}v
  • 问题变为:求解关于新的未知量v\mathbf{v}v对角化方程组dvdt=Λv\frac{d \mathbf{v}}{d t}=\boldsymbol{\Lambda} \mathbf{v}dtdv=Λv

新方程组的系数矩阵Λ\mathbf{\Lambda}Λ对角阵,即方程组每一行都形如dvidt=λivi\frac{d v_{i}}{d t}=\lambda_{i} v_{i}dtdvi=λivi
此时新方程组不存在耦合,或者说方程组各个未知量之间没有联系(系数矩阵为对角阵导致的)
新的 对角化方程组dvdt=Λv\frac{d \mathbf{v}}{d t}=\boldsymbol{\Lambda} \mathbf{v}dtdv=Λv的解为v(t)=eΛtv(0)\mathbf{v}(t)=e^{\Lambda t} \mathbf{v}(0)v(t)=eΛtv(0)

  • 通过坐标变换/基变换,可以得到原方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au的解为u(t)=Sv(t)=SeΛtv(0)=SeΛtS−1u(0)=eAtu(0)\mathbf{u}(t)=\boldsymbol{S}\mathbf{v}(t)=\boldsymbol{S}e^{\Lambda t} \mathbf{v}(0)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1} \mathbf{u}(0)=e^{\boldsymbol{A} t} \mathbf{u}(0)u(t)=Sv(t)=SeΛtv(0)=SeΛtS1u(0)=eAtu(0)也就是说方程dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au的解就是u(t)=eAtu(0)\mathbf{u}(t)=e^{\boldsymbol{A} t} \mathbf{u}(0)u(t)=eAtu(0),其中eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}eAt=SeΛtS1,意义是坐标变换(下面将会证明

结论:

  • (前提:若A\mathbf AA有n个无关的特征向量方程)dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}dtdu=Au的解解就是u(t)=eAtu(0)\mathbf{u}(t)=e^{\boldsymbol{A} t} \mathbf{u}(0)u(t)=eAtu(0),其中eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}eAt=SeΛtS1,意义是坐标变换(这里的Λ\boldsymbol{\Lambda}ΛS\boldsymbol{S}S来自对角化A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}A=SΛS1
  • 上面的通解u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=c1eλ1tx1+c2eλ2tx2是这里的一般方法在特征值个数为2时的一个特例,可以带入关系Sc=u(0)\boldsymbol{S}\mathbf{c}=\mathbf{u}(0)Sc=u(0)S=[x1,x2]\boldsymbol{S}=[\mathbf{x}_1,\mathbf{x}_2]S=[x1,x2]验证,u(t)=SeΛtS−1u(0)=SeΛtc=c1eλ1tx1+c2eλ2tx2\mathbf{u}(t)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1} \mathbf{u}(0)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\mathbf{c}=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}u(t)=SeΛtS1u(0)=SeΛtc=c1eλ1tx1+c2eλ2tx2
    这里我们将解表示成了特征值矩阵Λ\mathbf \LambdaΛ和特征向量矩阵S\mathbf SS的形式,这种矩阵形式更加通用
证明:矩阵的指数函数eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}eAt=SeΛtS1

我们希望研究eAte^{\mathbf At}eAt,这是个矩阵,但是其元素没有显式计算表示,而是需要通过下面的幂级数公式来计算!!!

目标:证明eAte^{\mathbf At}eAtA\mathbf AA的特征值矩阵Λ\mathbf \LambdaΛ和特征向量矩阵S\mathbf SS的关系为eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}eAt=SeΛtS1

利用指数函数的幂级数公式ex=∑n=0∞xnn!=1+x+x22+x36+⋯e^{x}=\sum_{n=0}^{\infty} \frac{x^{n}}{n !}=1+x+\frac{x^{2}}{2}+\frac{x^{3}}{6}+\cdotsex=n=0n!xn=1+x+2x2+6x3+,可以将指数部分exe^{x}ex变为幂次项xnx^{n}xn之和的形式,类比得到矩阵的指数函数eAte^{\mathbf At}eAt,可以写为eAt=I+At+(At)22+(At)36+⋯e^{\boldsymbol{A} t}=I+\boldsymbol{A} t+\frac{(\boldsymbol{A} t)^{2}}{2}+\frac{(\boldsymbol{A} t)^{3}}{6}+\cdotseAt=I+At+2(At)2+6(At)3+利用Ak=SΛkS−1\boldsymbol{A}^k=\boldsymbol{S} \boldsymbol{\Lambda}^k \boldsymbol{S}^{-1}Ak=SΛkS1,可以得到eAt=I+At+(At)22+(At)36+⋯=SS−1+SΛS−1t+SΛ2S−12t2+SΛ3S−16t3+⋯=S(I+Λt+Λ22t2+Λ36t3+⋯ )S−1=SeΛtS−1\begin{aligned}e^{\boldsymbol{A} t}&=I+\boldsymbol{A} t+\frac{(\boldsymbol{A} t)^{2}}{2}+\frac{(\boldsymbol{A} t)^{3}}{6}+\cdots\\ &=\boldsymbol{S} \boldsymbol{S}^{-1}+\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1} t+\frac{\boldsymbol{S} \boldsymbol{\Lambda}^{2} \boldsymbol{S}^{-1}}{2} t^{2}+\frac{\boldsymbol{S} \boldsymbol{\Lambda}^{3} \boldsymbol{S}^{-1}}{6} t^{3}+\cdots\\ &=\boldsymbol{S}\left(I+\boldsymbol{\Lambda} t+\frac{\Lambda^{2}}{2} t^{2}+\frac{\Lambda^{3}}{6} t^{3}+\cdots\right) \boldsymbol{S}^{-1}\\ &=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}\end{aligned}eAt=I+At+2(At)2+6(At)3+=SS1+SΛS1t+2SΛ2S1t2+6SΛ3S1t3+=S(I+Λt+2Λ2t2+6Λ3t3+)S1=SeΛtS1
注意,这里出现了S−1\boldsymbol{S}^{-1}S1,那么下面的一切成立的前提是,矩阵A必须具有n个线性无关的特征向量,从而矩阵才能对角化

最终,我们可以将eAte^{\mathbf At}eAt分解为eAt=SeΛtS−1,其中eΛt=[eλ1t0⋯00eλ2t0⋮⋱⋮0⋯0eλnt]e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1},其中e^{\Lambda t}=\left[\begin{array}{cccc} e^{\lambda_{1} t} & 0 & \cdots & 0 \\0 & e^{\lambda_{2} t} & & 0 \\ \vdots & & \ddots & \vdots \\0 & \cdots & 0 & e^{\lambda_{n} t}\end{array}\right]eAt=SeΛtS1,eΛt=eλ1t000eλ2t000eλnt

可见,A\mathbf AA有n个无关的特征向量方程,则eAte^{\mathbf At}eAtA\mathbf AA的特征值矩阵Λ\mathbf \LambdaΛ和特征向量矩阵S\mathbf SS的关系为eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}eAt=SeΛtS1(给出了eAte^{\mathbf At}eAt的显式计算式)

二阶微分方程

像之前的Fibonacci数列的例子,可以从二阶差分方程构造一阶的差分方程
同样的,给出二阶微分方程(同时出现了前后三项)y′′+by′+ky=0y^{\prime \prime}+b y^{\prime}+k y=0y+by+ky=0,我们也可以增加一个方程,得到一个方程组(可表示为矩阵向量乘法),从而将整体列向量变为新的变量,得到一阶微分方程

构造方程组{y′′=−by′−kyy′=y′\left\{\begin{matrix}y^{\prime \prime}=-b y^{\prime}-k y \\y^{\prime}=y^{\prime}\end{matrix}\right.{y=bykyy=y并令新的未知量u=[y′y]\mathbf{u}=\left[\begin{array}{l}y^{\prime} \\y\end{array}\right]u=[yy],则得到新方程组[y′′y′]=[−b−k10][y′y]即u′=[−b−k10]u\left[\begin{array}{l}y^{\prime \prime} \\y^{\prime}\end{array}\right] =\left[\begin{array}{cc}-b & -k \\1 & 0\end{array}\right]\left[\begin{array}{l}y^{\prime} \\y\end{array}\right]即\mathbf{u}^{\prime}=\left[\begin{array}{cc}-b & -k \\1 & 0\end{array}\right]\mathbf{u}[yy]=[b1k0][yy]u=[b1k0]u

可以推广到k阶微分方程,我们仍然添加(k-1)个额外方程,则u′=Au\mathbf{u}^{\prime}=\mathbf A\mathbf{u}u=Au的系数矩阵A\mathbf AA是一个k x k矩阵,这样k阶微分方程可以转化为一阶微分方程

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值