余弦相似度、余弦距离、欧式距离以及机器学习中距离的含义 问题1:为什么在一些场景中要使用余弦相似度而不是欧氏距离? 问题2:余弦距离是否是一个严格定义的距离? 参考资料 机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用 余弦相似度来表示。 余弦相似度的取值范围为[ -1, 1 ],相同的两个向量之间的相似度为1,将1减去余弦相似度即为 余弦距离。因此,余弦距离的取值范围为[0, 2],相同的两个向量余弦距离为0。 问题1:为什么在一些场景中要使用余弦相似度而不是欧氏距离? 对于两个向量A和B, 其余弦相似度定义为 c o s ( A , B ) = A ⋅