众所周知,矩阵即线性变换。但我一直有个疑点,就是对于一个线性变换作用的向量来说,线性变换究竟改变了它的什么?是名字,还是形状?
换言之,在线性变换的过程中,我们用什么来唯一标识这个向量?是名字还是形状?
形状不同,就是不同的向量吗?名字相同,就不可能画出多个都叫这个名字的向量吗?
而也只有理清了这一点,才能进而去理解更复杂的相似矩阵。
接下来,我们将按照从向量→基底→线性变换→矩阵→相似矩阵的顺序,由浅至深地理解。
向量
首先让我们明确一个概念:向量的“名”和“形”并不唯一对应。
也就是说,如果给你一个向量(1,2),让你画出它的形状,你是画不出来的!同理,如果在纸上给出一个箭头线段,问它代表的向量,你同样应该回答不知道。
为什么呢?这个问题可以去问秦始皇,因为他统一了度量衡(划掉)。
其实是因为我们缺少一个必不可少的参照,基底。
基底
向量形状,向量名字,基底,这三者是一个知二求一的大三角关系。
而对一个向量而言,同一个名字+不同基底会得到不同形状;同一个形状+不同基底会得到不同名字;固定同一个基底,形状和名字一一对应。
而很多人(包括我)会默认同基底的,会觉得不同形状的向量肯定名字不一样啊,一旦这么想就会很难理解相似矩阵了。
所以,我们其实可以发现,很难说到底是什么唯一标识一个向量。或者说,只有先手动确定这三个中的其中一个,以它为标识,我们才能去谈剩下两个的线性变换。
线性变换
首先,我们给出线性变换的(唯一)公式形式:
Ax1=x2
其中,x1、x2分别为两个拥有不同名字的向量,A为矩阵(线性变换)。
而由前文的大三角可知,由于有三个影响要素,所以我们可以指定任意一个为不变量,用剩下两个要素的变化关系来定义线性变换,也就是能产生三个定义:
①指定同基底
矩阵A(线性变换):在同一个基底下,把一个向量变成另一个完全陌生的向量,即使向量发生空间位置的变化。
②指定同名字
矩阵A(线性变换):描述在另一组基底下的同名向量,在本基底下的名字。
也可以理解成情况①赋予意义之后的版本,但是在变换后的x2不再是一个陌生向量了,而是在某个基底下与x1同名的向量。
不过这个定义有点过于弯弯绕绕,且和①重复,所以一般很少用到。
③指定同形状
个人认为最好的一种理解方式。
矩阵A(线性变换):描述在不同基底下,同一个向量形状的不同名字。
为什么这个定义最容易理解呢,因为公式的特性是不体现形状,只体现名字。
所以比如说第②种解释就有一种绕来绕去的美感——你说这两个向量同名不同形,可公式只体现名字,总不能填两个一样的名字前等后等吧?所以到头来还得转换到同一个基底让两个名字不等,才能形成公式——毕竟公式之所以叫公式就是等号两边要连接不同的变量。
而③就简单很多,因为本身两个向量名字就不一样,只不过画在纸上是同一个形状。(并且,用形状来唯一标识向量本身也更容易接受,人们天然会觉得形状不同就是不同的向量)
那么这里的A也因此被赋予了意义:与基底相关的矩阵。更特殊一点的情况下,如果基底之一是标准坐标系,那么:
A=[v1 v2],v1,v2为基底。
普通情况下:
这个推导过程有三个作用:
①对于一个向量(形状)而言,它的名字和基底是配套出现的,没有基底就没有名字!
②引出求逆矩阵这个知识点。
③回答了一开始的问题:如果一定要选出一个唯一标识向量的要素,选形状是最好理解的。
在上述线性变换的定义中,我们需要着重记忆的是①和③,它们是理解相似矩阵的基石,共同构成了相似矩阵的定义。
矩阵
由上文可知,矩阵的本质就是线性变换,是一个向量通往另一个向量的桥梁。而关于它自身的性质就有很多很多了,这放到另一个线性代数总结的帖子里讲。
相似矩阵
终于,到了最初的疑点——相似矩阵到底是个什么东西?
如果用线性变换来解释,那就是——①③结合的船新版本。
事实上,如果把①③的示意图拼在一起,就是相似矩阵的示意图:
简而言之,相似矩阵也是矩阵,矩阵的本质是什么?两个向量的线性变换;那么相似矩阵的本质就是:两个矩阵的线性变换,或者说是线性变换的线性变换。
(1)线性变换(T0版本)
1.公式:Ax1=x2
2.理解:两个向量进行线性变换③
3.含义:相同的向量(形状)在不同基底下,有不同的向量名
(2)相似矩阵(T1版本)
1.公式:A(Px1)=Px2=P(Bx1)
2.两个矩阵进行线性变换③,而矩阵为:两个向量进行线性变换①
3.含义:相同的线性变换①在不同基底下,有不同的矩阵表示
ps. 相同的线性变换①指两个变化前的向量形状相同,变化后的向量形状同样相同。
所以相似矩阵其实可以理解为一款复合线性变换,或者线性变换²。
总结
所以再回头看,我们可以将这些概念简要概括为:
向量:名字、形状、基底三要素,知二求一
线性变换:固定向量三要素之一,剩下两要素随机组合(1个公式,3个定义)
矩阵:向量→向量的线性变换
相似矩阵:矩阵→矩阵的线性变换