马氏数据聚类:原理、算法与应用
1. 平面中的马氏距离类函数
在平面中,以原点为中心,半轴长为 (a,b > 0),绕原点旋转角度 (\theta) 的椭圆 (E(O, a, b, \theta)) 有如下方程:
[
\frac{(x_1 \cos \theta + x_2 \sin \theta)^2}{a^2} + \frac{(-x_1 \sin \theta + x_2 \cos \theta)^2}{b^2} = 1
]
其中 (x = (x_1, x_2) \in R^2)。通过定义 (U =
\begin{bmatrix}
\cos \theta & -\sin \theta \
\sin \theta & \cos \theta
\end{bmatrix}) 以及 (\Sigma := U \text{diag}(a^2, b^2) U^T),上述椭圆方程可写为 (x \Sigma x^T = 1)。
实际上,平面中所有以原点为中心的椭圆集合与所有对称正定的 (2 \times 2) 矩阵集合之间存在一一对应关系。例如,对于以原点为中心、半径为 (r) 的圆盘 (K(0, r) \subset R^2),其面积为 (r^2\pi)。对该圆盘进行各种变形,在一个方向上拉伸/收缩,在正交方向上收缩/拉伸,可得到半轴长为 (a) 和 (b) 的椭圆,且其面积仍为 (r^2\pi),即 (ab = r^2),与旋转角度 (\theta) 无关。
为了使椭圆上所有点到原点的距离相同,我们定义马氏距离类函数 (d_m : R^2 \times R^2 \to R^+) 为:
超级会员免费看
订阅专栏 解锁全文
3097

被折叠的 条评论
为什么被折叠?



