聚类分析方法全面解析
1. 聚类基础与距离度量
在聚类分析中,距离度量是基础且关键的部分。首先,我们可以定义一些属性的距离,例如:
- distance a (behind_right, behind_right ) = 0
- distance a (behind_right, infront_right) = 0.25
- distance a (behind_right, behind_left ) = 0.75
基于这样的属性距离度量,我们可以将不同的距离度量变体定义为一种映射: distance : B² → R⁺ ( R⁺ 表示正实数集),具体计算方式为:
distance(x,y) = 1/D Σ distance a (x(a), y(a)) ,其中 a∈D ,且 D = domain (x) ∩ domain(y) 。
对于名义数据,有专门设计的距离系数。其计算基于列联表,如下表所示:
| 观测 j 的状态 | 观测 i 的状态 | |
|---|---|---|
| 0 | 1 | |
| 0 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



