机器学习中的距离度量、相似性、范数

scott198512

已于 2022-06-12 10:27:08 修改

阅读量746

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习算法人工智能

于 2022-05-10 20:41:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/scott198510/article/details/124696901

机器学习专栏收录该内容

39 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了机器学习中用于衡量样本间差异和概率分布相似度的各种度量方法，包括点距离度量（如欧氏距离、曼哈顿距离、切比雪夫距离等）、概率分布距离（如KL散度、Hellinger distance和Chi-squared distance）、相似性度量（如余弦相似性和相关系数）以及范数的概念。这些度量在算法设计中起到关键作用，影响模型的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.概述

在机器学习方法中，无论是有监督学习还是无监督学习都使用各种度量来得到不同样本数据的差异度或者不同样本数据对应概率分布之间的相似度。良好的度量可以显著提高算法的分类或预测的准确率。本文基于距离、相似度以及相关系数，研究数据点之间及数据对应的概率分布之间的距离。

2.点距离度量

给定样本空间 $X$ ， $X$ 是 $m$ 维实数空间中数据点的集合，其中 $x_i,x_j \in X$ , $x_i=(x_{1i},x_{2i},...,x_{mi})^T$ ,

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

scott198512 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。