【CS285】听说过“欧氏距离”，这个“马氏距离（Mahalanobis distance）”又是什么呀？

最新推荐文章于 2025-04-03 14:16:20 发布

songyuc

最新推荐文章于 2025-04-03 14:16:20 发布

阅读量834

点赞数 12

文章标签：人工智能

本文链接：https://blog.youkuaiyun.com/songyuc/article/details/145785710

版权

From DeepSeek-R1-web

马氏距离（Mahalanobis Distance）是一个衡量数据点之间“真实距离”的工具，它比欧氏距离更智能。我们可以通过一个简单例子来理解它。

1. 先复习欧氏距离

假设你在平面上有两个点 ( A(1,2) ) 和 ( B(4,6) )，它们的欧氏距离是：
$\sqrt{(4-1)^2 + (6-2)^2} = 5$
特点：欧氏距离默认每个坐标轴的重要性相同，且坐标轴之间完全独立（比如x轴和y轴没有关联）。

2. 马氏距离要解决的问题

假设你考试有两门科目：数学和语文。

情况1：数学成绩的分数范围是0-100，语文也是0-100。此时用欧氏距离合理。
情况2：数学成绩的范围是0-100，但语文成绩的范围是0-10（比如按10分制评分）。
问题：直接算欧氏距离时，语文的1分差异会被放大（因为范围小），而数学的1分差异被缩小。
解决方法：马氏距离通过考虑数据的分布（比如方差、协方差），自动调整不同维度的“重要性”。

3. 马氏距离的直观理解

想象一群学生的数学和语文成绩分布成一个椭圆（而不是正圆），椭圆的长轴和短轴方向代表成绩的变化趋势。

欧氏距离：像用圆规画圆，无论椭圆方向如何，都按正圆测量距离。
马氏距离：会沿着椭圆的形状“拉伸或压缩”坐标系，使椭圆变成一个正圆，再计算距离。
结果：在椭圆分布的数据中，马氏距离能更真实地反映点之间的相似性。

4. 数学定义

设数据点 $\mathbf{x}$ ，均值为 $\mathbf{\mu}$ ，协方差矩阵为 $\Sigma$ ，则马氏距离为：
$D_{\text{Mahalanobis}} = \sqrt{ (\mathbf{x} - \mathbf{\mu})^T \Sigma^{-1} (\mathbf{x} - \mathbf{\mu}) }$
关键点：

$\Sigma^{-1}$ 是协方差矩阵的逆，用来“标准化”不同维度的尺度（比如将语文成绩的10分制转换为与数学的100分制可比）。
如果数据各维度独立且方差相同，马氏距离退化为欧氏距离。

5. 回到课程公式

在策略 $\pi_{\theta}(\mathbf{a}_t | \mathbf{s}_t)$ 中：

动作 $\mathbf{a}_t$ 服从以 $f(\mathbf{s}_t)$ 为均值、 $\Sigma$ 为协方差的高斯分布。
使用马氏距离 $\| f(\mathbf{s}_t) - \mathbf{a}_t \|_{\Sigma}^2$ ，相当于：
1. 考虑不同动作维度的方差（比如某些关节的移动范围大，某些小）。
2. 考虑动作维度之间的相关性（比如两个关节联动时，它们的动作可能相关）。