在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。
相似性度量:从欧氏距离到马氏距离
本文详细介绍了多种常见的相似性度量方法,包括欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德距离、相关系数及信息熵。通过对比这些度量,探讨了它们在不同场景下的适用性和优缺点。
本文的目的就是对常用的相似性度量作一个总结。

被折叠的 条评论
为什么被折叠?