约束聚类:现状与新趋势
在数据挖掘和机器学习领域,约束聚类是一个重要的研究方向,它允许用户通过设定约束条件来引导聚类过程,从而得到更符合特定需求的聚类结果。本文将介绍经典聚类算法在用户约束下的扩展方法,以及声明式约束聚类方法。
经典聚类算法的扩展
经典聚类算法在引入用户约束后,有了多种扩展方式,主要包括 k-Means、度量学习和谱图理论相关方法。这些方法具有以下共同特点:
1. 集成约束 :将聚类算法进行扩展,以集成用户约束,并且与聚类算法所优化的目标函数相关,例如 k-Means 算法的目标是最小化误差平方和。
2. 约束类型 :集成实例级约束或某种形式的簇级约束,如簇的大小。
3. 求解特性 :通常速度较快,找到的是近似解,不能保证满足所有约束条件。
k-Means 扩展
k-Means 算法是一种常用的聚类算法,在引入用户约束后有多种扩展方式。
- 强制成对约束 :
- COP-COBWEB :修改了 COBWEB 算法,试图满足所有成对约束。
- COP-KMeans :扩展了 k-Means 算法,在每次迭代中选择不违反任何约束的重新分配,但可能无法找到满足所有约束的解。
- Seed-KMeans 和 Constrained-KMeans :允许使用标记为种子的对象,克服了 k-Means 对初始参数化的敏感性。
超级会员免费看
订阅专栏 解锁全文
91

被折叠的 条评论
为什么被折叠?



