机器学习中的距离度量、相似性、范数

本文探讨了机器学习中用于衡量样本间差异和概率分布相似度的各种度量方法,包括点距离度量(如欧氏距离、曼哈顿距离、切比雪夫距离等)、概率分布距离(如KL散度、Hellinger distance和Chi-squared distance)、相似性度量(如余弦相似性和相关系数)以及范数的概念。这些度量在算法设计中起到关键作用,影响模型的准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.概述

在机器学习方法中,无论是有监督学习还是无监督学习都使用各种度量来得到不同样本数据的差异度或者不同样本数据对应概率分布之间的相似度。良好的度量可以显著提高算法的分类或预测的准确率。本文基于距离、相似度以及相关系数,研究数据点之间及数据对应的概率分布之间的距离。

2.点距离度量

        给定样本空间XX 是 m 维实数空间中数据点的集合,其中 x_i,x_j \in X,    x_i=(x_{1i},x_{2i},...,x_{mi})^T,  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

scott198512

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值