欧式距离和马氏距离的关系（公式推导）

最新推荐文章于 2025-11-07 17:57:16 发布

原创

最新推荐文章于 2025-11-07 17:57:16 发布 · 5.4k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#线性代数 #机器学习 #数据挖掘 #算法

本文详细解析了欧氏距离和马氏距离的概念及应用，对比了两者在衡量样本间距离上的区别，特别是在考虑数据分布特性时马氏距离的优势。

                    
                    欧氏距离（Euclidean Distance）与马氏距离（Mahalanobis Distance） 
欧氏距离 
度量样本和样本分布间的距离d(x,μ)=(x−μ)T(x−μ) \begin{aligned} d(x,\mu)=\sqrt{(x-\mu)^T(x-\mu)} \end{aligned} d(x,μ)=(x−μ)T(x−μ) 
                      
                     ​​其中x=(x1,x2,…,xn)Tx=(x_1,x_2,…,x_n)^Tx=(x1​,x2​,…,xn​)T是n维向量，μ=(μ1,μ2,…,μn)T\mu=(\mu_1,\mu_2,…,\mu_n)^Tμ=(μ1​,μ2​,…,μn​)T是样本分布的中心，即 d(x,μ)=∑i=1n(xi−μi)2 \begin{aligned} d(x,\mu)=\sqrt{\sum_{i=1}^n(x_i-\mu_i)^2} \end{aligned} d(x,μ)=i=1∑n​(xi​−μi​)2 
                      
                     ​​
度量样本和样本的距离 d(x,y)=(x−y)T(x−y) \begin{aligned} d(x,y)=\sqrt{(x-y)^T(x-y)} \end{aligned} d(x,y)=(x−y)T(x−y) 
                      
                     ​​其中，x=(x1,x2,…,xn)Tx=(x_1,x_2,…,x_n)^Tx=(x1​,x2​,…,xn​)T、y=(y1,y2,…,yn)Ty=(y_1,y_2,…,y_n)^Ty=(y1​,y2​,…,yn​)T均为n维向量，即d(x,y)=∑i=1n(xi−yi)2 \begin{aligned} d(x,y)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2} \end{aligned} d(x,y)=i=1∑n​(xi​−yi​)2 
                      
                     ​​
 
协方差 
对于m个一维数据(x1,x2,…,xm)(x_1,x_2,…,x_m)(x1​,