在数据分析和机器学习领域,计算数据之间的距离是一项重要任务。距离度量可以帮助我们比较不同数据点之间的相似性或差异性,从而进行聚类、分类、异常检测等任务。本文将介绍几种常见的距离度量方法,并提供相应的源代码实现。
- 欧氏距离(Euclidean Distance)
欧氏距离是最常用的距离度量方法之一,用于计算两个点之间的直线距离。对于二维空间中的两个点(x1, y1)和(x2, y2),欧氏距离的计算公式为:
import math
def euclidean_distance(x1, y1, x2, y2):
return math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)
# 示例
distance = euclidean_distance(1, 2, 4, 6)
print(distance) # 输出:5.0
- 曼哈顿距离(Manhattan Distance)
曼哈顿距离是另一种常见的距离度量方法,也称为城市街区距离。它计算两个点在坐标轴上的绝对距离之和。对于二维空间中的两个点(x1, y1)和(x2, y2),曼哈顿距离的计算公式为:
def manhattan_distance(x1, y1, x2, y2):
return abs(x2 - x1) + abs(y2 - y1)
# 示