计算数据之间的距离

本文介绍了机器学习和数据分析中常用的几种距离度量方法,包括欧氏距离、曼哈顿距离、闵可夫斯基距离和切比雪夫距离,并提供了Python代码实现。这些距离度量在聚类、分类和异常检测任务中发挥关键作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在数据分析和机器学习领域,计算数据之间的距离是一项重要任务。距离度量可以帮助我们比较不同数据点之间的相似性或差异性,从而进行聚类、分类、异常检测等任务。本文将介绍几种常见的距离度量方法,并提供相应的源代码实现。

  1. 欧氏距离(Euclidean Distance)
    欧氏距离是最常用的距离度量方法之一,用于计算两个点之间的直线距离。对于二维空间中的两个点(x1, y1)和(x2, y2),欧氏距离的计算公式为:
import math

def euclidean_distance(x1, y1, x2, y2):
    return math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)

# 示例
distance = euclidean_distance(1, 2, 4, 6)
print(distance)  # 输出:5.0
  1. 曼哈顿距离(Manhattan Distance)
    曼哈顿距离是另一种常见的距离度量方法,也称为城市街区距离。它计算两个点在坐标轴上的绝对距离之和。对于二维空间中的两个点(x1, y1)和(x2, y2),曼哈顿距离的计算公式为:
def manhattan_distance(x1, y1, x2, y2):
    return abs(x2 - x1) + abs(y2 - y1)

# 示
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值