线性代数让我想想:相似矩阵与矩阵的相似对角化

本文探讨了相似矩阵的概念,阐述了矩阵在不同基下的代数表达,并深入解析了相似对角化的概念,重点介绍了对称矩阵对角化的条件。通过实例说明如何找到简单的对角矩阵表示,并揭示了特征值在对角化过程中的关键作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

相似矩阵与矩阵的相似对角化

一、相似矩阵

首先我们来看教材的定义:

定义:设 A , B \boldsymbol{A}, \boldsymbol{B} A,B 都是 n n n 阶矩阵,若存在可逆矩阵 P \boldsymbol{P} P,使得 P − 1 A P = B \boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B} P1AP=B,则称 B \boldsymbol{B} B A \boldsymbol{A} A 的相似矩阵,或 A \boldsymbol{A} A 相似于 B \boldsymbol{B} B,记成 A ∼ B \boldsymbol{A} \sim \boldsymbol{B} AB. ——永乐全书P256

根据我们对矩阵乘法的理解(参考之前的文章),我们都知道矩阵其实是一种线性变换,那么,如果对于一个向量,左乘或者右乘一个矩阵其实就是施加了一次线性变换操作。

在这里插入图片描述

一个向量的基本特征包括方向和模长。通常情况下我们会采用“坐标”的方式去描述一个向量。也就是我们用一组数值去刻画一个向量的特征。而且这个坐标的坐标系会选取自然坐标系(自然基)。那么,向量还是这个向量,我们换一个坐标系去描述这个向量,可不可以呢?

在这里插入图片描述

我们尝试选取另外一组基去表示这个向量,然后我们发现,向量的坐标,或者说代表向量的数值产生了变化。那么这个向量还是原来的向量吗?是的,因为这个向量的方向和模长并没有发生变化。只是我们采用了与以往不同的视角去看待它了。

在理解这个地方的时候,我们通常会提到一个著名且有趣的比喻:猪照理论。即我们用照相机在不同的位置对一只猪进行拍照,我们洗出来的照片肯定是不相同的,但猪猪还是那个猪猪,这是不变的。

我们把这套理论扩展到矩阵,首先,由于我们可以把矩阵看作成一个列向量组,我们依然可以用向量的视角去讨论它们;其次,矩阵本质上也是它所代表的线性变换操作,所以两个矩阵相乘可以表达对列向量组进行基变换的过程。比如说这样一个矩阵 A A A ,它代表将某个向量旋转 θ \theta θ 度,拉伸 λ \lambda λ 倍,那么在直角坐标系下的变换可能如下图所示:

在这里插入图片描述

接下来我们对向量进行如下操作:

首先,我改变该线性变换所在的基,那么从数值表示上来看,向量和矩阵的数值都发生了改变。

然后,在新的基下,我对向量施加 A A A 线性变换,得到新的向量。此时,我们会发现,不考虑数值特征的话,该向量变换前后的几何含义是一样的,也是旋转 θ \theta θ 度,拉伸 λ \lambda λ 倍。

在这里插入图片描述

于是我们得出相似矩阵的几何意义:相似矩阵是同一个线性变换在不同基下的代数表达(数值表示)

**直观上,**我们对相似矩阵的定义式进行感受性的理解:
P − 1 A P = B P^{-1} AP=B P1AP=B
我们对矩阵 A A A 左乘一个矩阵 P − 1 P^{-1} P1 是对矩阵 A A A 进行了一系列的行变换,也就是基变换(即在同一个向量空间下对基底进行变换),然后我们对得到的矩阵进行右乘 P P P 的操作,也就是一系列的列变换(即对同一个基底变换向量空间)。

下面我们进行代数推导:

推导条件: x = P x ′ x=Px' x=Px y = A x y=Ax y=Ax y ′ = B x ′ y'=Bx' y=Bx y = P y ′ y=Py' y=Py

序号步骤意义解释结果
1 y = P y ′ y=Py' y=Py y ′ y' y 通过基变换( 2 → 1 2\rightarrow1 21)可以得到 y y y y y y
2 y = A x = P ( y ′ = B x ′ ) y=Ax=P(y'=Bx') y=Ax=P(y=Bx)整理化简得到下一步 y y y
3$Ax=PBx’ $ x x x 在旧基下的线性变换可以通过 x ′ x' x 在新基下的线性变换进行基变换得到 y y y
4 A ( x = P x ′ ) = P B x ′ A(x=Px')=PBx' A(x=Px)=PBx整理化简得到下一步 y y y
5 A P x ′ = P B x ′ APx'=PBx' APx=PBx x ′ x' x 先通过基变换( 2 → 1 2\rightarrow1 21)得到旧基下的 x x x,再进行线性变换Ⅰ,等同于
x ′ x' x 先在新基下进行线性变换Ⅱ,再进行基变换( 2 → 1 2\rightarrow1 21)
y y y
6 P − 1 A P x ′ = B x ′ P^{-1}APx'=Bx' P1APx=Bx x ′ x' x 先基变换( 2 → 1 2\rightarrow1 21)后进行线性变换Ⅰ,然后进行基变换( 1 → 2 1\rightarrow2 12),等同于
直接进行线性变换Ⅱ
y ′ y' y
7 P − 1 A P = B P^{-1}AP=B P1AP=B

在映射的语境下,矩阵实际代表了线性变化的过程,也可以称为广义线性函数。

二、相似对角化

有了相似矩阵之后,我们要考虑的问题是,那么多的相似矩阵,我们要研究哪个或者哪些才好呢?当然我们期望寻求一个既能体现其本质,又简单的相似矩阵来研究。

那么我们考虑两个问题:本质是什么?谁是简单的?
相似矩阵的本质是同一个线性变换在不同基下的代数表达,于是我们保留本质的过程就变成了寻求新基的过程。
而对角阵显而易见是我们能找到的在不丢失向量信息(不降维)下最简单的矩阵。

于是问题变成了:我们如何寻求一个新基表示下最简单的相似矩阵。

这个问题的求解就是所谓的相似对角化。

我们发现,通过相似对角化后的矩阵,其对角线是矩阵的特征值。这意味着,我们找到了一组新基,尽可能简单地表达了矩阵。同时,特征值意味着基变换的过程中仅仅进行了伸缩变换(由特征值定义)。于是我么可以得到:

线性变换的相似对角化实质是寻找一个适当的坐标系,使得该变换对这个新的坐标系上的单位向量(或基向量)只做伸缩变换、不做旋转变换。

三、相似对角化的条件

那么紧接着我们就会考虑一个问题:什么样的矩阵才可以对角化?

(等待更新ing)

  • 是对称阵——>✅
  • 不是对称阵——>求特征值
    • 特征值全是单根——>✅
    • 特征值重数与线性无关特征向量个数一致——>✅
    • 存在n个线性无关的特征向量——>✅

参考文章:(3 封私信) 为啥得线性无关才能对角化,从几何意义上怎么理解,多谢大神? - 知乎 (zhihu.com)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值