聚类
簇内相似度高,簇间相似度低。
下式为闵可夫斯基距离
dist(xi,xj)=(∑u=1n|xiu−xju|p)1pdist(xi,xj)=(∑u=1n|xiu−xju|p)1p
当 p=1p=1 时为曼哈顿距离;当 p=2p=2 时为欧氏距离。
但这样的计算方式只适合有序属性(“1与2”比“1与3”更进一下),对于无序属性,可以使用VDM距离,即两个属性值在各个样本簇上的分布差异。
聚类方法
- k-means
- 高斯混合聚类
- DBSCAN:密度聚类
- 层次聚类:自底而上