线性代数学习笔记7-3：特征值的应用——解微分方程、矩阵的指数函数

原创已于 2024-06-04 23:10:50 修改 · 3.9k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#线性代数 #矩阵

于 2022-08-26 16:22:51 首次发布

线性代数学习笔记专栏收录该内容

43 篇文章

订阅专栏

本文介绍了一阶导数常系数微分方程的解法，重点在于使用特征值分解的方法来简化问题，将其转化为指数函数的形式。通过具体实例说明了如何找到微分方程的通解，并探讨了稳态的概念。

之前介绍了求解一阶差分方程，本文介绍求解一阶导数常系数微分方程

常系数微分方程的解是指数形式的 $eλte^{\lambda t}$ ，基于这个事实，我们得以将问题转为线性代数的问题，求解其指数和系数
另外，在微分方程中将会看到特征值的另一应用：除了可以帮助我们求矩阵的幂，还可以求矩阵的指数

举例：一阶微分方程

对于一阶微分方程 ${du1dt=−u1+2u2du2dt=u1−2u2\left\{\begin{matrix}\frac{d u_{1}}{d t} &=-u_{1}+2 u_{2} \\\frac{d u_{2}}{d t} &=u_{1}-2 u_{2} \\\end{matrix}\right.$ ，初始条件为 $u_1=1,u_2=0$

类比之前的差分方程，微分方程可以表示为一个方程组（未知量组成一个整体的列向量 $u\boldsymbol u$ ，系数为 $A\mathbf A$ ） $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 其中 $A=[−121−2],u(0)=[10]\boldsymbol{A}=\left[\begin{array}{cc}-1 & 2 \\1 & -2\end{array}\right], \quad \mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]$
我们的最终目标是找到 $u (t)$ ，或者说追踪 $u$ 随时间的变化及最终的值

[结论] 方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 的通解形式为 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t}) =c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$

其中，特征向量 $λi\lambda_i$ 和特征值 $xi\mathbf{x}_i$ 来自特征值分解 $A=XΛX−1\boldsymbol{A} =\boldsymbol{X} \boldsymbol{\Lambda} \boldsymbol{X}^{-1}$
系数 $c_i$ 由初值条件给出（一旦确定后系数恒定不变），本质就是通过特征向量的线性组合表示初始状态的组合系数，即 $Xc=u(0)\mathbf X\boldsymbol c=\boldsymbol u(0)$ ；
注意，之前讲的差分方程中，出现纯幂形式 $c1λ1kx1+c2λ2kx2+...c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}+...$ ；
而微分方程中出现纯指数形式 $c1eλ1tx1+c2eλ2tx2+...c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}+...$ ，两者作用类似
例如将特解 $c1eλ1tx1c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}$ 代入方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 中验证：得到 $c1λ1eλ1tx1=Au=c1Aeλ1tx1c_{1} \lambda_{1}e^{\lambda_{1} t} \mathbf{x}_{1}=\boldsymbol{A} \mathbf{u}=c_{1} \boldsymbol{A}e^{\lambda_{1} t} \mathbf{x}_{1}$ ，即 $λ1x1=Ax1\lambda_{1} \mathbf{x}_{1}=\mathbf A\mathbf{x}_{1}$ ，可见，这里纯指数主要是用于保证“微分后形式仍保持不变”

证明：方程的通解 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t}) =c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$ / 探究为何微分方程中出现指数函数
微分方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 中的 $dudt\frac{d \mathbf{u}}{d t}$ ，就相当于差分方程中前后两项之差 $uk+1−uk\mathbf u _{k+1}-\mathbf u _{k}$ ，只不过两项的距离无限小；
或者说，从 $u (0)$ 到 $u (t)$ 认为经历了 $N→∞N\rightarrow \infty$ 个差分方程，每个方程对应了时长为 $Δt/N\Delta_t/N$ 的小时隙
那么，将某个时刻的值 $u(t)∣t=kΔtu(t)|_{t=k\Delta_t}$ 记为 $u_k$ ，则微分方程可以暂时视为 $dudt=uk+1−ukΔt=uk+1−ukt/N=Auk\frac{d \mathbf{u}}{d t} =\frac{\mathbf{u}_{k+1}-\mathbf{u}_{k}}{\Delta t}=\frac{\mathbf{u}_{k+1}-\mathbf{u}_{k}}{t / N}=\boldsymbol{A} \mathbf{u}_{k}$
改写得到 $uk+1=(tNA+1)uk\mathbf{u}_{k+1}=\left(\frac{t}{N} \boldsymbol{A}+1\right) \mathbf{u}_{k}$ 这是上一节所学的内容，可以知道最终的值 $u(t)\mathbf{u}(\mathrm{t})$ ，等价于差分方程的最终值 $uN\mathbf{u}_N$ $u(t)=uN=c1(tNλ1+1)Nx1+c2(tNλ2+1)Nx2\mathbf{u}(t)=\mathbf{u}_{N}=c_{1}\left(\frac{t}{N} \lambda_{1}+1\right)^{N} \mathbf{x}_{1}+c_{2}\left(\frac{t}{N} \lambda_{2}+1\right)^{N} \mathbf{x}_{2}$ ，并且考虑到 $lim⁡k→∞(1k+1)k→e\lim _{k \rightarrow \infty}\left(\frac{1}{k}+1\right)^{k} \rightarrow e$ ，从差分变为微分，得到其通解形式： $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$

求解 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ ，其中 $A=[−121−2],u(0)=[10]\boldsymbol{A}=\left[\begin{array}{cc}-1 & 2 \\1 & -2\end{array}\right], \quad \mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]$ ：

首先求 $A\boldsymbol{A}$ 的特征值： $λ1=0,x1=[21]\lambda_{1}=0,\mathbf{x} 1=\left[\begin{array}{l}2 \\1\end{array}\right]$ 和 $λ1=−3,x1=[1−1]\lambda_{1}=-3,\mathbf{x} 1=\left[\begin{array}{l}1\\-1\end{array}\right]$
将初始状态表示为特征向量的线性组合，也就是求解 $Xc=u(0)\mathbf X\boldsymbol c=\boldsymbol u(0)$ ： $1=c2=1/3\mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]=c_{1}\left[\begin{array}{l}2 \\1\end{array}\right]+c_{2}\left[\begin{array}{c}1 \\-1\end{array}\right] \text {,其中c } 1=\mathrm{c} 2=1 / 3$
根据上述的通解 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$ ，代入系数 $c$ 和特征值 $λ\lambda$ 、特征向量 $x\mathbf{x}$ 解得 $u(t)=c1eλ1tx1+c2eλ2tx2=c1e0[21]+c2e−3t[1−1]=13[21]+13e−3t[1−1]\begin{array}{l} \mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2} \\=c_{1} e^{0}\left[\begin{array}{l}2 \\1\end{array}\right] +c_{2} e^{-3 t}\left[\begin{array}{c}1 \\-1\end{array}\right] \\=\frac{1}{3}\left[\begin{array}{l}2 \\1\end{array}\right]+\frac{1}{3} e^{-3 t}\left[\begin{array}{c}1 \\-1\end{array}\right] \end{array}$

分析：随着 $t$ 的增大，答案中第二项会消失，而第一项为稳态（当有0特征值时，就出现稳态SteadyState）’
如果初态 $u(0)=[10]\mathbf{u}(0)=\left[\begin{array}{l}1 \\0\end{array}\right]$ ，那么最终的稳态就是 $u(t)∣t=∞=13[21]\begin{array}{l} \mathbf{u}(\mathrm{t})|_{t=\infty}=\frac{1}{3}\left[\begin{array}{l}2 \\1\end{array}\right]\end{array}$

关于“稳态”：

对于通解 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$
矩阵的特征值给出了 $u(t)\mathbf{u}(\mathrm{t})$ 的发展趋势（稳定性）：

将 $eλ1te^{\lambda_{1} t}$ 视为 $AejϕAe^{j\phi}$ 的形式，则实部 $Re{λ}Re\{\lambda\}$ 决定了稳定性（即决定幅值的增长速度，因为 $e^{a+jb}|=|e^{a}||e^{jb}|=|e^{a}|$ ），虚部 $Im{λ}Im\{\lambda\}$ 对应了单位圆上的相位旋转
$Re{λ}>0Re\{\lambda\}>0$ ，对应项发散； $Re{λ}=0Re\{\lambda\}=0$ ，对应项幅值稳定不变； $Re{λ}<0Re\{\lambda\}<0$ ，对应项消失（ $t→∞时u(t)→0t\rightarrow \infty 时\mathbf{u}(\mathrm{t})\rightarrow 0$ ）

对比复习：
①之前的矩阵的幂的情况
如果其所有特征值 $∣λi∣<1|\lambda_i|<1$ ，则 $k→∞时Ak→0k\rightarrow \infty时\boldsymbol{A}^k\rightarrow 0$ （因为 $Λk→0\boldsymbol{\Lambda}^k\rightarrow 0$ ，故 $Ak=SΛkS−1→0\boldsymbol{A}^k=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}\rightarrow 0$ ）
②之前的差分方程的稳态情况（主要取决于幅值 $∣λi∣|\lambda_i|$ ）
对于实数特征值，特征值 $∣λi∣<1|\lambda_i|<1$ 的项最终会消失，特征值 $∣λi∣=1|\lambda_i|=1$ 的项恒定，特征值 $∣λi∣>1|\lambda_i|>1$ 的项最终不断增长
对于复数特征值，虚部引入了复平面上的“旋转”，故特征值的幅值仍然确定稳态，而相位则对应了每次做矩阵乘法时特征向量的旋转角度

综合考虑所有特征值对于解的稳态的影响：
①若所有 $Re{λ}≤0Re\{\lambda\}\leq0$ （对应项消失/幅值稳定不变），则可以进入稳态
②一旦存在 $Re{λ}>0Re\{\lambda\}>0$ ，则发散

另外，我们比较关注二阶系统的稳定性，一个推论是：

假如行列式 $det(A)>0det(\mathbf A)>0$ 而 $trace(A)<0trace(\mathbf A)<0$ （这等价于说二阶矩阵有两个实部为负的特征值），则微分方程的解可以进入稳态

扩展：从方程解耦（特征值分解）的角度求解微分方程

下文一切讨论的前提： $A\mathbf A$ 的特征向量矩阵 $S\mathbf S$ 可逆/ $A\mathbf A$ 有n个无关的特征向量，因为此时才能保证可对角化（从而用于解耦的特征向量数量是足够的）
将矩阵对角化（特征值分解）为 $A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}$

下面从另一角度考虑一般的一阶微分方程的求解原理，探究为什么一阶微分方程的解是指数函数 $eλte^{\lambda t}$ 的和的形式（之前已经证明，这里从另一角度理解）；

出发角度是：
将问题转换到另一坐标系（基向量为特征向量），从而解耦方程，得到解，再转换回原坐标系；
具体的解耦方法：
对于未知量相互耦合的方程组，用特征值和特征向量来对角化方程的系数矩阵，可以实现解耦（各未知量没有关系）

关于变量的耦合与解耦
对于一阶微分方程 ${du1dt=−u1+2u2du2dt=u1−2u2\left\{\begin{matrix}\frac{d u_{1}}{d t} &=-u_{1}+2 u_{2} \\\frac{d u_{2}}{d t} &=u_{1}-2 u_{2} \\\end{matrix}\right.$ ，也就是 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$

原方程有两个相互耦合(coupled)的未知函数 $u_1,u_2$ ；
找出 $A\boldsymbol{A}$ 的特征值和特征向量（即对角化），可以实现解耦，即将方程组每一行变为可以独立求解的单个方程，他们之间互不相干
实际上后面会看到，解耦的两个方程的解就对应了最终通解的两个分量 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$ ；

进一步的，下面研究如何将解表示为特征值矩阵 $Λ\mathbf \Lambda$ 和特征向量矩阵 $S\mathbf S$ 的形式

对于 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 方程，原方程未知数 $u_1,u_2$ 耦合，即 $A\boldsymbol{A}$ 不是对角阵
希望解耦，就是说希望将 $A\boldsymbol{A}$ 对角化 $A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}$ （出现对角的系数矩阵意味着各未知数互不干扰），方法是：

将 $u\mathbf{u}$ 写为特征向量的线性组合形式 $u=Sv\mathbf{u}=\mathbf{S v}$
其中 $v\mathbf{v}$ 为新的未知量（代替原来的未知量 $u\mathbf{u}$ ）， $S\mathbf S$ 矩阵是 $A\boldsymbol{A}$ 的特征向量矩阵
$u=Sv\mathbf{u}=\mathbf{S v}$ 带入原方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ ，得到 $Sdvdt=ASv⇒dvdt=S−1ASv=Λv\begin{array}{l}\boldsymbol{S} \frac{d \mathbf{v}}{d t}=\boldsymbol{A} \boldsymbol{S} \mathbf{v} \\\Rightarrow \frac{d \mathbf{v}}{d t}=\boldsymbol{S}^{-1} \boldsymbol{A} \boldsymbol{S} \mathbf{v}=\boldsymbol{\Lambda} \mathbf{v}\end{array}$

可以理解为：

以特征向量为坐标系的基，求解问题（带入 $u=Sv\mathbf{u}=\mathbf{S v}$ ，原未知量 $u\mathbf{u}$ 在新的基下的坐标为 $v\mathbf{v}$ ，即新的未知量为 $v\mathbf{v}$ ）
问题变为：求解关于新的未知量 $v\mathbf{v}$ 的对角化方程组 $dvdt=Λv\frac{d \mathbf{v}}{d t}=\boldsymbol{\Lambda} \mathbf{v}$

新方程组的系数矩阵 $Λ\mathbf{\Lambda}$ 为对角阵，即方程组每一行都形如 $dvidt=λivi\frac{d v_{i}}{d t}=\lambda_{i} v_{i}$ ；
此时新方程组不存在耦合，或者说方程组各个未知量之间没有联系（系数矩阵为对角阵导致的）
新的对角化方程组 $dvdt=Λv\frac{d \mathbf{v}}{d t}=\boldsymbol{\Lambda} \mathbf{v}$ 的解为 $v(t)=eΛtv(0)\mathbf{v}(t)=e^{\Lambda t} \mathbf{v}(0)$

通过坐标变换/基变换，可以得到原方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 的解为 $u(t)=Sv(t)=SeΛtv(0)=SeΛtS−1u(0)=eAtu(0)\mathbf{u}(t)=\boldsymbol{S}\mathbf{v}(t)=\boldsymbol{S}e^{\Lambda t} \mathbf{v}(0)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1} \mathbf{u}(0)=e^{\boldsymbol{A} t} \mathbf{u}(0)$ 也就是说方程 $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 的解就是 $u(t)=eAtu(0)\mathbf{u}(t)=e^{\boldsymbol{A} t} \mathbf{u}(0)$ ，其中 $eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}$ ，意义是坐标变换（下面将会证明）

结论：

（前提：若 $A\mathbf A$ 有n个无关的特征向量方程） $dudt=Au\frac{d \mathbf{u}}{d t} =\boldsymbol{A} \mathbf{u}$ 的解解就是 $u(t)=eAtu(0)\mathbf{u}(t)=e^{\boldsymbol{A} t} \mathbf{u}(0)$ ，其中 $eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}$ ，意义是坐标变换（这里的 $Λ\boldsymbol{\Lambda}$ 和 $S\boldsymbol{S}$ 来自对角化 $A=SΛS−1\boldsymbol{A} =\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1}$ ）
上面的通解 $u(t)=c1eλ1tx1+c2eλ2tx2\mathbf{u}(\mathrm{t})=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$ 是这里的一般方法在特征值个数为2时的一个特例，可以带入关系 $Sc=u(0)\boldsymbol{S}\mathbf{c}=\mathbf{u}(0)$ 和 $S=[x1,x2]\boldsymbol{S}=[\mathbf{x}_1,\mathbf{x}_2]$ 验证， $u(t)=SeΛtS−1u(0)=SeΛtc=c1eλ1tx1+c2eλ2tx2\mathbf{u}(t)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1} \mathbf{u}(0)=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\mathbf{c}=c_{1} e^{\lambda_{1} t} \mathbf{x}_{1}+c_{2} e^{\lambda_{2} t} \mathbf{x}_{2}$
这里我们将解表示成了特征值矩阵 $Λ\mathbf \Lambda$ 和特征向量矩阵 $S\mathbf S$ 的形式，这种矩阵形式更加通用

证明：矩阵的指数函数 $eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}$

我们希望研究 $eAte^{\mathbf At}$ ，这是个矩阵，但是其元素没有显式计算表示，而是需要通过下面的幂级数公式来计算！！！

目标：证明 $eAte^{\mathbf At}$ 与 $A\mathbf A$ 的特征值矩阵 $Λ\mathbf \Lambda$ 和特征向量矩阵 $S\mathbf S$ 的关系为 $eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}$

利用指数函数的幂级数公式 $ex=∑n=0∞xnn!=1+x+x22+x36+⋯e^{x}=\sum_{n=0}^{\infty} \frac{x^{n}}{n !}=1+x+\frac{x^{2}}{2}+\frac{x^{3}}{6}+\cdots$ ，可以将指数部分 $e^{x}$ 变为幂次项 $x^{n}$ 之和的形式，类比得到矩阵的指数函数 $eAte^{\mathbf At}$ ，可以写为 $eAt=I+At+(At)22+(At)36+⋯e^{\boldsymbol{A} t}=I+\boldsymbol{A} t+\frac{(\boldsymbol{A} t)^{2}}{2}+\frac{(\boldsymbol{A} t)^{3}}{6}+\cdots$ 利用 $Ak=SΛkS−1\boldsymbol{A}^k=\boldsymbol{S} \boldsymbol{\Lambda}^k \boldsymbol{S}^{-1}$ ，可以得到 $)S−1=SeΛtS−1\begin{aligned}e^{\boldsymbol{A} t}&=I+\boldsymbol{A} t+\frac{(\boldsymbol{A} t)^{2}}{2}+\frac{(\boldsymbol{A} t)^{3}}{6}+\cdots\\ &=\boldsymbol{S} \boldsymbol{S}^{-1}+\boldsymbol{S} \boldsymbol{\Lambda} \boldsymbol{S}^{-1} t+\frac{\boldsymbol{S} \boldsymbol{\Lambda}^{2} \boldsymbol{S}^{-1}}{2} t^{2}+\frac{\boldsymbol{S} \boldsymbol{\Lambda}^{3} \boldsymbol{S}^{-1}}{6} t^{3}+\cdots\\ &=\boldsymbol{S}\left(I+\boldsymbol{\Lambda} t+\frac{\Lambda^{2}}{2} t^{2}+\frac{\Lambda^{3}}{6} t^{3}+\cdots\right) \boldsymbol{S}^{-1}\\ &=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1}\end{aligned}$
注意，这里出现了 $S−1\boldsymbol{S}^{-1}$ ，那么下面的一切成立的前提是，矩阵A必须具有n个线性无关的特征向量，从而矩阵才能对角化

最终，我们可以将 $eAte^{\mathbf At}$ 分解为 $eAt=SeΛtS−1,其中eΛt=[eλ1t0⋯00eλ2t0⋮⋱⋮0⋯0eλnt]e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t} \boldsymbol{S}^{-1},其中e^{\Lambda t}=\left[\begin{array}{cccc} e^{\lambda_{1} t} & 0 & \cdots & 0 \\0 & e^{\lambda_{2} t} & & 0 \\ \vdots & & \ddots & \vdots \\0 & \cdots & 0 & e^{\lambda_{n} t}\end{array}\right]$

可见，若 $A\mathbf A$ 有n个无关的特征向量方程，则 $eAte^{\mathbf At}$ 与 $A\mathbf A$ 的特征值矩阵 $Λ\mathbf \Lambda$ 和特征向量矩阵 $S\mathbf S$ 的关系为 $eAt=SeΛtS−1e^{\mathbf At}=\boldsymbol{S} e^{\boldsymbol{\Lambda} t}\boldsymbol{S}^{-1}$ （给出了 $eAte^{\mathbf At}$ 的显式计算式）

二阶微分方程

像之前的Fibonacci数列的例子，可以从二阶差分方程构造一阶的差分方程
同样的，给出二阶微分方程（同时出现了前后三项） $y′′+by′+ky=0y^{\prime \prime}+b y^{\prime}+k y=0$ ，我们也可以增加一个方程，得到一个方程组（可表示为矩阵向量乘法），从而将整体列向量变为新的变量，得到一阶微分方程

构造方程组 ${y′′=−by′−kyy′=y′\left\{\begin{matrix}y^{\prime \prime}=-b y^{\prime}-k y \\y^{\prime}=y^{\prime}\end{matrix}\right.$ 并令新的未知量 $u=[y′y]\mathbf{u}=\left[\begin{array}{l}y^{\prime} \\y\end{array}\right]$ ，则得到新方程组 $[y′′y′]=[−b−k10][y′y]即u′=[−b−k10]u\left[\begin{array}{l}y^{\prime \prime} \\y^{\prime}\end{array}\right] =\left[\begin{array}{cc}-b & -k \\1 & 0\end{array}\right]\left[\begin{array}{l}y^{\prime} \\y\end{array}\right]即\mathbf{u}^{\prime}=\left[\begin{array}{cc}-b & -k \\1 & 0\end{array}\right]\mathbf{u}$