定义:如果矩阵 A , B A,B A,B满足 A = P − 1 B P A = P^{-1}BP A=P−1BP 则称 A A A和 B B B相似。
相似性 可解释为"不同视角下观察相同的内容得到的表现形式是相似的"(类比从同一方向不同远近观察同一个物体,呈现的是形状一样但大小不一样的画面)。
在矩阵相似 A = P − 1 B P A = P^{-1}BP A=P−1BP中 ,矩阵 P P P代表观察视角 , 也即 P P P代表一个坐标系【本质是坐标转换矩阵】,则 A A A所代表的线性变换是在 P P P坐标系下观察的 B B B变换。本质是在不同坐标系下观察相同的变换但得到的矩阵的表观内容是不一样的。
A = P − 1 B P A = P^{-1}BP A=P−1BP 的几何定义说明:
对于一个 P P P坐标系的向量 [ x ⃗ ] P [\vec x]_P [x]P应用变换 A A A就有: A ∗ [ x ⃗ ] P = P − 1 B P ∗ [ x ⃗ ] P \ \ \ A*[\vec x]_P = P^{-1}BP*[\vec x]_P A∗[x]P=P−1BP∗[x]P
\, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, 根据坐标变换可知: P ∗ [ x ⃗ ] P P*[\vec x]_P P∗[x]P是将 P P P坐标系的向量 [ x ⃗ ] P [\vec x]_P [x]P转换到标准坐标系下 [ x ⃗ ] ε = P ∗ [ x ⃗ ] P [\vec x]_\varepsilon = P*[\vec x]_P [x]ε=P∗[x]P进行描述;
∴ B P ∗ [ x ⃗ ] P → B [ x ⃗ ] ε \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \,\therefore BP*[\vec x]_P \rightarrow B[\vec x]_\varepsilon ∴BP∗[x]P→B[x]ε表示对在标准坐标系下的向量 [ x ⃗ ] ε [\vec x]_\varepsilon [x]ε 进行 B B B 变换;
\, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, 又 根据坐标变换可知: P − 1 [ x ⃗ ] ε P^{-1} [\vec x]_{\varepsilon} P−1[x]ε表示将标准坐标系下的向量 [ x ⃗ ] ε [\vec x]_{\varepsilon} [x]ε转换到 P P P坐标系下进行描述为$ [\vec x]_{P}$;
∴ P − 1 B P [ x ⃗ ] P = P − 1 ∗ B [ x ⃗ ] ε \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \, \,\therefore P^{-1}BP[\vec x]_{P}=P^{-1}*B[\vec x]_\varepsilon ∴P−1BP[x]P=P−1∗B[x]ε描述的是将标准坐标系下 B B B变换后的向量 [ x ⃗ ] ε [\vec x]_\varepsilon [x]ε变换回 P P P坐标系下,等价了在 P P P坐标系下应用了 A A A变换的向量 [ x ⃗ ] P [\vec x]_P [x]P。因此定义了变换矩阵 A A A与 B B B的相似,也即 A , B A,B A,B表征了同一种变换,这里的 B B B变换矩阵是标准坐标系下 ε \varepsilon ε下描述的,而 A A A变换矩阵是在 P P P坐标系下描述的,从而 A A A变换解释为是在 P P P坐标系下描述的 B B B变换矩阵。
等式变形:
A
=
P
−
1
B
P
→
B
=
P
A
P
−
1
A = P^{-1}BP \rightarrow B = PAP^{-1}
A=P−1BP→B=PAP−1
A
=
P
−
1
B
P
A = P^{-1}BP
A=P−1BP 是对夹在
P
,
P
−
1
P,P^{-1}
P,P−1之外的
A
A
A变换矩阵在
P
P
P坐标系下进行描述;
B
=
P
A
P
−
1
B = PAP^{-1}
B=PAP−1 是对夹在
P
,
P
−
1
P,P^{-1}
P,P−1之内的
A
A
A变换矩阵在
P
P
P坐标系下进行描述。
特征方程与矩阵相似
矩阵相似背后的重要特征: A A A和 B B B矩阵如果表征相同的变换,那么它们的特征方程相同,特征值一样!** 所以说,特征方程和特征值标识的是矩阵所代表的变换的特征,不同的坐标系下矩阵的描述可能会改变,但是矩阵所表示的变换不变。
证明:
∵ det ( A − λ I ) = det ( P − 1 B P − λ I ) \ \ \ \ \ \because \det(A -\lambda I) = \det (P^{-1}BP - \lambda I) ∵det(A−λI)=det(P−1BP−λI)
= det ( P − 1 B P − λ P − 1 P ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (P^{-1}BP - \lambda P^{-1}P) =det(P−1BP−λP−1P)
= det ( P − 1 ( B − λ I ) P ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (P^{-1}(B - \lambda I)P) =det(P−1(B−λI)P)
= det ( P − 1 ) ∗ det ( B − λ I ) ∗ det ( P ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (P^{-1}) * \det (B - \lambda I) *\det (P) =det(P−1)∗det(B−λI)∗det(P)
= det ( B − λ I ) ∗ det ( P − 1 ) det ( P ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (B - \lambda I)*\det (P^{-1})\det (P) =det(B−λI)∗det(P−1)det(P)
= det ( B − λ I ) ∗ det ( P − 1 P ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (B - \lambda I)*\det (P^{-1}P) =det(B−λI)∗det(P−1P) ###参考行列式计算
= det ( B − λ I ) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ = \det (B - \lambda I) =det(B−λI)∴ det ( A − λ I ) = det ( B − λ I ) \ \ \ \ \ \therefore \det(A -\lambda I) = \det (B - \lambda I) ∴det(A−λI)=det(B−λI) 从而当 A A A和 B B B矩阵相似,其特征方程是一样的。
在不同坐标系下观察的表现形式不同但表征相同变换的矩阵的相似性被其特征值所表征。
引出问题:观测一个对象可以从任意视角进行观察,那么在这些视角中,就会存在一个最佳视角,从这个视角进行观察可以更容易的对观察对象进行描述以及方便计算。