马氏距离(Mahalanobis Distance)是一种距离的度量,可以看作是欧氏距离的一种修正,修正了欧式距离中各个维度尺度不一致且相关的问题。
马氏距离(Mahalanobis Distance)是由马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。
对于一个均值为μ = ( μ 1 , μ 2 , μ 3 , . . . , μ p ) T μ=(μ_1,μ_2,μ_3,...,μ_p)^Tμ=(μ1,μ2,μ3,...,μp)T,协方差矩阵为S SS的多变量x = ( x 1 , x 2 , x 3 , . . . , x p ) T x=(x_1,x_2,x_3,...,x_p)^Tx=(x1,x2,x3,...,xp)T,
马氏距离为:
我们可以发现如果Σ^(-1)是单位阵的时候,马氏距离简化为欧氏距离。
那我们为什么要用马氏距离呢?
马氏距离有很多优点: 马氏距离不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;
由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的

马氏距离是一种距离度量,可看作欧氏距离的修正,能解决其维度尺度不一致和相关问题。它表示数据的协方差距离,不受量纲影响,可排除变量相关性干扰。通过实例说明,马氏距离能使特征关系更符合实际,计算更科学合理。

最低0.47元/天 解锁文章
2666





