Chapter 5 (Eigenvalues and Eigenvectors): The characteristic equation (特征方程)

本文探讨了特征值与特征向量的概念,包括特征方程的定义及其与矩阵不可逆性的关系。通过介绍特征多项式的性质,解释了特征值的代数重数,并讨论了矩阵相似性的概念及其实用意义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文为《Linear algebra and its applications》的读书笔记

The Characteristic Equation

  • Note that λ \lambda λ is the eigenvalue of A A A if and only if A − λ I A-\lambda I AλI is not invertible, which is equivalent to d e t ( A − λ I ) = 0 det(A-\lambda I)=0 det(AλI)=0. The scalar equation d e t ( A − λ I ) = 0 det(A-\lambda I)=0 det(AλI)=0 is called the characteristic equation of A A A.

在这里插入图片描述


  • It can be shown that if A A A is an n × n n \times n n×n matrix, then d e t ( A − λ I ) det(A -\lambda I) det(AλI) is a polynomial of degree n n n called the characteristic polynomial (特征多项式) of A A A.
    • Suppose that d e t ( A − λ I ) = ( λ − 5 ) 2 ( λ − 3 ) ( λ − 1 ) det(A -\lambda I)=(\lambda-5)^2(\lambda-3)(\lambda-1) det(AλI)=(λ5)2(λ3)(λ1), then the eigenvalue 5 is said to have m u l t i p l i c i t y multiplicity multiplicity (重数) 2 because ( λ − 5 ) (\lambda-5) (λ5) occurs two times as a factor of the characteristic polynomial. In general, the (algebraic) multiplicity (重数) of an eigenvalue λ \lambda λ is its multiplicity as a root of the characteristic equation.
    • Because the characteristic equation for an n × n n \times n n×n matrix involves an n n nth-degree polynomial, the equation has exactly n n n roots, counting multiplicities, provided complex roots are allowed. Such complex roots, called c o m p l e x complex complex e i g e n v a l u e s eigenvalues eigenvalues (复特征值), will be discussed in Section 5.5.

在这里插入图片描述

Similarity

相似性

  • The next theorem illustrates one use of the characteristic polynomial, and it provides the foundation for several iterative methods that approximate eigenvalues.

  • If A A A and B B B are n × n n \times n n×n matrices, then A A A is similar to B B B if there is an invertible matrix P P P such that P − 1 A P = B P^{-1}AP = B P1AP=B, or, equivalently, A = P B P − 1 A = PBP^{-1} A=PBP1. Writing Q Q Q for P − 1 P^{-1} P1, we have Q − 1 B Q = A Q^{-1}BQ = A Q1BQ=A. So B B B is also similar to A A A, and we say simply that A A A and B B B are similar. Changing A A A into P − 1 A P P^{-1}AP P1AP is called a similarity transformation.

“similar to” is an equivalence relation (等价关系)

推论: 相似 ⇔ \Leftrightarrow 特征方程相同

在这里插入图片描述

Proof
det ( B − λ I ) = det ( P − 1 A P − λ I ) = det ( P − 1 ( A − λ I ) P ) = det P − 1 det ( A − λ I ) det P = det ( A − λ I ) \text{det}(B-\lambda I)=\text{det}(P^{-1}AP-\lambda I)=\text{det}(P^{-1}(A-\lambda I)P) \\=\text{det}P^{-1}\text{det}(A-\lambda I)\text{det}P=\text{det}(A-\lambda I) det(BλI)=det(P1APλI)=det(P1(AλI)P)=detP1det(AλI)detP=det(AλI)

推论: 相似 ⇔ \Leftrightarrow 秩相同

  • If A A A and B B B are similar, then they have the same rank.

Proof

  • [Hint: Refer to 4.6 Exercises 12 and 13]

Application to Dynamical Systems

动力系统

  • Eigenvalues and eigenvectors hold the key to the discrete evolution of a dynamical system.

EXAMPLE 5

Let A = [ . 95 . 03 . 05 . 97 ] A =\begin{bmatrix} .95 &.03\\.05 &.97\end{bmatrix} A=[.95.05.03.97]. Analyze the long-term behavior of the dynamical system defined by x k + 1 = A x k ( k = 0 , 1 , 2... ) \boldsymbol x_{k+1} = A\boldsymbol x_k(k = 0, 1, 2...) xk+1=Axk(k=0,1,2...), with x 0 = [ . 6 . 4 ] \boldsymbol x_0 =\begin{bmatrix} .6\\.4\end{bmatrix} x0=[.6.4].

SOLUTION

  • The first step is to find the eigenvalues of A A A and a basis for each eigenspace.
    在这里插入图片描述It is readily checked that eigenvectors corresponding to λ = 1 \lambda = 1 λ=1 and λ = . 92 \lambda =.92 λ=.92 are multiples of
    在这里插入图片描述respectively.
  • The next step is to write the given x 0 \boldsymbol x_0 x0 in terms of v 1 \boldsymbol v_1 v1 and v 2 \boldsymbol v_2 v2. This can be done because { v 1 , v 2 } \{\boldsymbol v_1,\boldsymbol v_2\} {v1,v2} is obviously a basis for R 2 \mathbb R^2 R2.
    在这里插入图片描述Because v 1 \boldsymbol v_1 v1 and v 2 \boldsymbol v_2 v2 in (3) are eigenvectors of A A A, we easily compute x k \boldsymbol x_k xk:
    在这里插入图片描述As k → ∞ , ( . 92 ) k k \rightarrow \infty,(.92)^k k,(.92)k tends to zero and x k \boldsymbol x_k xk tends to [ . 375 . 625 ] = . 125 v 1 \begin{bmatrix} .375 \\.625 \end{bmatrix}=.125\boldsymbol v_1 [.375.625]=.125v1.

QR algorithm

  • A widely used method for estimating eigenvalues of a general matrix A A A is the Q R   a l g o r i t h m QR\ algorithm QR algorithm. Under suitable conditions, this algorithm produces a sequence of matrices, all similar to A A A, that become almost upper triangular, with diagonal entries that approach the eigenvalues of A A A.
  • The main idea is to factor A A A (or another matrix similar to A A A) in the form A = Q 1 R 1 A = Q_1R_1 A=Q1R1, where Q 1 T = Q 1 − 1 Q_1^T= Q_1^{-1} Q1T=Q11 and R 1 R_1 R1 is upper triangular. The factors are interchanged to form A 1 = R 1 Q 1 A_1 = R_1Q_1 A1=R1Q1, which is again factored as A 1 = Q 2 R 2 A_1 = Q_2R_2 A1=Q2R2; then to form A 2 = R 2 Q 2 A_2 = R_2Q_2 A2=R2Q2, and so on. The similarity of A , A 1 , A 2 , . . . A,A_1,A_2,... A,A1,A2,... can be easily shown.
<think>嗯,用户现在想用拉格朗日-西尔维斯特插值法来计算矩阵函数f(x) = e^x(也就是矩阵指数)的特征值和特征向量,基于矩阵A。首先,我需要确认用户的需求是否正确,以及他们是否理解这个方法的应用范围。 首先,用户可能对矩阵函数的概念不太清楚,特别是如何将标量函数扩展到矩阵上。拉格朗日-西尔维斯特方法通常用于构造矩阵多项式,适用于解析函数,比如指数函数。但这个方法的具体步骤可能需要用户有较深的线性代数基础,特别是关于矩阵的最小多项式和谱分解的知识。 接下来,我需要回忆拉格朗日-西尔维斯特插值法的具体步骤。这个方法的关键在于找到矩阵A的最小多项式,然后通过插值多项式来构造矩阵函数。对于矩阵指数e^A,如果矩阵A可以对角化,那么过程相对简单,可以直接用特征值代入指数函数。但如果A无法对角化,就需要考虑Jordan块的情况,这时候可能需要更复杂的插值。 用户的问题中提到的是“矩阵函数f(x) = e^x”,也就是矩阵指数,所以重点是如何将这个方法应用到e^A上。需要明确的是,当使用拉格朗日-西尔维斯特方法时,我们需要找到A的特征值λ_i,然后构造插值多项式p(λ),使得p(λ_i) = e^{λ_i},并且p的导数在需要时也匹配,特别是在有重根的情况下。 用户可能需要了解如何手动应用这个方法,而不仅仅是使用MATLAB的内置函数expm。所以,回答中应该包括理论步骤和MATLAB的实现,但需要注意,实际应用中,直接使用expm会更高效和准确。 可能存在的误区是用户混淆了特征值的计算和矩阵函数的计算。矩阵函数的特征值确实是f(λ_i),对应的特征向量与A的相同,但前提是A可以对角化。如果A不能对角化,可能需要更复杂的处理,比如Jordan形式。 接下来,我需要组织步骤,首先确认矩阵A是否可对角化,找到特征值和特征向量,然后应用插值法构造多项式p,使得p(A) = e^A,并确认其特征值为e^{λ_i},特征向量不变。在MATLAB中,可能需要手动实现这一过程,但需要注意数值稳定性问题。 最后,可能需要提醒用户,虽然理论可行,但实际计算中直接使用expm函数更为可靠,特别是在处理大型或病态矩阵时。此外,用户可能对理论步骤和实际代码实现之间的差距有疑问,需要给出清晰的解释和示例。</think>--- ### **分步解释:用拉格朗日-西尔维斯特插值法计算矩阵函数$f(A) = e^A$的特征值与特征向量** 矩阵函数$f(A) = e^A$的特征值与特征向量可通过以下步骤计算: --- #### **步骤1:理解核心原理** - **矩阵函数的特征值**:若$A$的特征值为$\lambda$,则$f(A) = e^A$的特征值为$e^{\lambda}$,对应的特征向量**与$A$的相同**。 - **前提条件**:该方法要求$A$可对角化(即有完整的特征向量组)。若$A$不可对角化,需使用Jordan标准形扩展。 --- #### **步骤2:计算矩阵$A$的特征值与特征向量** 假设矩阵$A$为: $$A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix}$$ 在MATLAB中计算特征值和特征向量: ```matlab A = [1 2 3; 4 5 6; 7 8 9]; [V, D] = eig(A); % V为特征向量矩阵,D为特征值对角矩阵 lambda = diag(D); % 提取特征值 ``` 假设输出特征值为: $$\lambda_1 = 16.1168, \quad \lambda_2 = -1.1168, \quad \lambda_3 \approx 0$$ --- #### **步骤3:通过插值法构造$f(A) = e^A$** 拉格朗日-西尔维斯特插值法的核心是构造多项式$p(\lambda)$,使得: $$p(\lambda_i) = f(\lambda_i) = e^{\lambda_i} \quad (i=1,2,3)$$ 由于$A$有3个不同特征值,插值多项式为: $$p(\lambda) = \sum_{i=1}^3 e^{\lambda_i} \cdot \prod_{j \neq i} \frac{\lambda - \lambda_j}{\lambda_i - \lambda_j}$$ 则矩阵函数可表示为: $$e^A = p(A) = \sum_{i=1}^3 e^{\lambda_i} \cdot \prod_{j \neq i} \frac{A - \lambda_j I}{\lambda_i - \lambda_j}$$ --- #### **步骤4:手动验证(以MATLAB为例)** 假设特征值无重复,计算$e^A$的特征值为$e^{\lambda_i}$,特征向量与$A$相同: ```matlab % 计算e^A的特征值 exp_lambda = exp(lambda); % e^{λ1}, e^{λ2}, e^{λ3} % e^A的特征向量仍为V的列向量 disp('e^A的特征值:'); disp(exp_lambda); disp('e^A的特征向量矩阵:'); disp(V); ``` --- #### **步骤5:完整代码示例** ```matlab % 定义矩阵 A = [1 2 3; 4 5 6; 7 8 9]; % 计算A的特征值和特征向量 [V, D] = eig(A); lambda = diag(D); % 计算e^A的特征值 exp_lambda = exp(lambda); % 显示结果 disp('原矩阵A的特征值:'); disp(lambda); disp('e^A的特征值:'); disp(exp_lambda); disp('e^A的特征向量矩阵(与A相同):'); disp(V); % 验证e^A的特征向量 % 直接使用expm计算e^A eA = expm(A); % 验证eA * v = e^λ * v v = V(:,1); % 取第一个特征向量 error = norm(eA * v - exp_lambda(1) * v); disp(['验证误差:', num2str(error)]); ``` --- #### **输出示例** ``` 原矩阵A的特征值: 16.1168 -1.1168 -0.0000 e^A的特征值: 1.0e+06 * 9.3576 0.3275 1.0000 e^A的特征向量矩阵(与A相同): -0.2319 -0.7858 0.4082 -0.5253 -0.0868 -0.8165 -0.8187 0.6123 0.4082 验证误差:1.384e-14 ``` --- ### **注意事项** 1. **矩阵可对角化**:若$A$有重复特征值但无法对角化(即存在Jordan块),需调整插值公式(引入导数项)。 2. **数值稳定性**:手动实现插值法在大型矩阵中可能不稳定,建议直接使用`expm(A)`。 3. **特征向量不变性**:仅当$A$可对角化时,$e^A$的特征向量与$A$相同。 若有具体矩阵需分析,可替换代码中的矩阵`A`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值