“距离(distance)”、“相似度(similarity)”相关的量的小结

本文总结了在数据科学中常用的‘距离(distance)’和‘相似度(similarity)’概念,包括欧氏距离、余弦相似度等度量方式,并探讨了它们在分类、聚类等任务中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

英文名 中文名 算式 说明
Euclidean Distance 欧式距离
d=i=1n(xiyi)2
以古希腊数学家欧几里得命名的距离;也就是我们直观的两点之间直线最短的直线距离
Manhattan Distance 曼哈顿距离
d=i=1n|xiyi|
是由十九世纪的赫尔曼·闵可夫斯基所创词汇;是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和;也就是和象棋中的“車”一样横平竖直的走过的距离;曼哈顿距离是超凸度量
Minkowski Distance 闵氏距离
d=i=1n(xiyi)pp
以俄罗斯数学家闵可夫斯基命名的距离;是欧式距离的推广,p=2时等价于欧氏距离,和p-范数等值
Hamming Distance 海明距离 逐个字符(或逐位)对比,统计不一样的位数的个数总和 所得值越小,参与对比的两个元素约相似;下面是从wikipedia借的4bit的海明距离示意图4bit的海明距离示意图
Jaccard Coefficient 杰卡德距离
J(A,B)=|AB||AB|
越大越相似;分子是A和B的交集大小,分母是A和B的并集大小
Ochiai Coefficient ?
K=n(AB)n(A)×n(B)
 
Pearson Correlation 皮尔森相关系数
r=ni=1(Xix¯)(yiy
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值