进化聚类与经济学中的进化计算
1. 进化聚类概述
进化聚类是一种强大的聚类方法,它在处理复杂的数据聚类问题时展现出独特的优势。为了便于理解,我们先来看一个简单的例子。假设我们要将十个项目(A, B, C, …, J)聚类成任意数量的组。在简单编码中,我们可以将聚类表示为一个包含十个标签的向量,这些标签独立地从 1 到 10 中选择,其中第 i 个元素表示第 i 个项目的组标签。例如,向量 2 3 5 5 1 5 7 3 2 7 表示的分组为:(A, I) (B, H) (C, D, F) (E) (G, I)。
在这种表示下,一个典型的遗传操作可能是随机改变单个父聚类中的一个标签。比如,我们可以选择上述向量中的第五个元素,并将其随机更改为 7,这样就有效地将项目 E 与项目 G 和 I 置于同一组中。
1.1 标准聚类方法的局限性
传统的聚类分析方法通常假设聚类围绕特定位置中心分布,并且一个点属于某个聚类的可能性会随着其与该位置的距离单调递减。然而,像图 2 中右侧的“反向 C”形聚类,大多数标准聚类分析方法无法可靠地将其检测为一个与包含在其中的两个项目组不同的独立聚类。而进化聚类的优势之一在于它能够灵活地处理任意定义的有效聚类,不受传统假设的限制。
1.2 进化聚类的目标函数
聚类问题本质上是多目标的,但大多数方法仅使用单一的性能标准进行优化。通常,聚类中常用的标准可分为至少三组:紧凑性、连通性和空间分离性。
- 紧凑性 :当算法优化紧凑性时,意味着聚类应仅由高度同质的数据项组成,即同一聚类中项目之间的距离(或其他变异度量)应较小。
-
超级会员免费看
订阅专栏 解锁全文
33

被折叠的 条评论
为什么被折叠?



