空间相关性发现:聚类算法的研究与实践
1. 聚类算法概述
聚类算法旨在将相似的对象归为一组,然而正式定义这一目标时会遇到困难。主要有两种聚类方法:划分式聚类和通用聚类。
划分式聚类,也称为层次聚类,是传统的聚类方法。在某些情况下,聚类和划分是同义词。例如,有人将聚类定义为“将相似的项目划分为不同的组”。划分式聚类的特点是每个簇要么完全包含在其他簇中,要么与其他簇完全不相交。这种方法适用于需要将对象集划分为不相交类别的情况,可简化网络,使每个类别可作为独立实体处理,常用于VLSI设计、有限元方法和运输等领域。
通用聚类则允许个体同时属于多个组。在社交网络中,一个人可能属于多个不同的群体,如职业、宗教、政治活动群体等。通用聚类算法能将个体归入所有相关的簇,而划分式聚类只能将个体归入一个簇,因此通用聚类更能反映现实世界的集群结构,但处理重叠组的问题更为复杂。
2. 划分式聚类的相关指标
许多划分式聚类算法试图最小化簇之间的连接数量,即划分的割边大小。此外,还有一些相关指标:
- r - 分隔器指标 :在最小化割边大小的同时,平衡簇的大小。
- 介数指标 :通过移除可能将网络分割成组件的边来找到小的割边。
- 扩展和电导指标 :用于定义划分式聚类中簇的质量。
- 特征向量相关性指标 :衡量同一簇的成员与网络邻接矩阵特征向量值的相关性。
3. 通用聚类算法
通用聚类问题的研究不如划分式聚类广泛,但也存在一些用于发现
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



