本篇文章并不打算描述所有这些类别,要具体阐述它们的细节和意义实在有点困难。这个大纲的目的,第一:提供一个貌似详细的距离度量的分类体系,列出相关的关键字。 第二:就像一个词典一样供参考和查阅,如果需要了解具体的细节,可以参考wiki或者具体文献。
大纲:
1. 相似性和不相似性的定义
2. 预备概念
3. 距离度量
3.1 Numerical Data
3.1.1 欧拉距离(Euclidean Distance)
3.1.2 曼哈顿距离(Manhattan Distance)
3.1.3.最大距离(Maximum Distance)
3.1.4 明考夫斯基距离(MinKowski Distance)
3.1.5 马式距离(Mahalanobis Distance)
3.1.6 平均距离(Average Distance)
3.1.7 其他距离:Chord Distance,Geodesic distance,…..
3.2 Categorical Data
&

本文提供了一个详细的距离度量分类体系,包括Numerical、Categorical、Binary、Mixed-type和Time Series Data等多种数据类型的距离度量方法,如欧氏距离、曼哈顿距离、马式距离等,并介绍了概率变量的相似性度量。同时,文章还阐述了相似性和不相似性的定义,以及Proximity Matrix和离差矩阵等相关概念。
最低0.47元/天 解锁文章
9308

被折叠的 条评论
为什么被折叠?



