【机器学习的一些问题】模型评估之余弦距离

机器学习的过程中,不仅要评估一个模型,也需要评估样本间的距离。特征用向量表示,则特征的相似性由向量的相似性而来,向量的相似性用余弦相似度表示。余弦相似度取值为[-1,1],为了得到类似于距离的表示,用1减去余弦相似度即为余弦距离,余弦距离取值为[0,2]。

 

一个严格定义的距离应满足正定性,对称性和三角不等式这三条距离公理,余弦距离不满足三角不等式,不是一个严格定义的距离。

 

文本、图像、视频等领域,研究对象的特征维度往往很高,余弦相似度在高维情况下仍保持“相同为1,正交为0,相反为-1”的性质;而欧氏距离则受维度影响,范围不固定,在特征空间中往往非常之大。总体来说,欧氏距离体现在数值上的绝对差异,余弦距离体现方向上的相对差异。比如在视频观看的活跃度上,应采用欧式距离关注数值的绝对差异;而在视频观看的偏好度上,应采用余弦距离关注方向的相对差异。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值