受限聚类方法综述
1. 实例级约束的聚类方法
在聚类分析中,实例级约束的引入为数据划分提供了更多的先验信息,有助于提高聚类的准确性和有效性。以下将详细介绍几种基于实例级约束的聚类方法。
1.1 凝聚层次聚类算法中的实例级约束
部分研究人员在凝聚层次聚类算法中考虑使用实例级约束。他们首先利用必须链接(must - link)约束形成小块(chunklets),以此作为算法的初始数据划分。这种方式确保了所有必须链接约束在最终划分中都能得到满足,因为初始聚类不会被拆分。
在凝聚层次聚类算法中,聚类间距离的度量至关重要。研究人员使用的距离函数包含两个项:聚类离散度度量和不能链接(cannot - link)约束的违反项。他们采用了两种不同的离散度度量方法:质心法和沃德法。
- 质心法 :将两个聚类之间的距离度量为它们中心之间的距离。对于聚类 (c_i) 及其中心 (\mu_i),设 (E(c_i)=\sum_{x\in c_i}|x - \mu_i|^2)。
- 沃德法 :两个聚类 (c_i) 和 (c_j) 之间的距离计算为 (E(c_i\cup c_j)-E(c_i)-E(c_j))。
算法从小块开始,合并最接近的两个聚类,直到获得所需数量的聚类。研究人员还比较了质心法和沃德法在有无高斯核的情况下的结果,计算表明他们的方法优于 COP - K - means 算法。
1.2 基于距离的方法
与有标签数据的聚类问题类似,具有实例级约束的聚类问题可以分两个阶段处理。
- 第一阶段
受限聚类方法研究综述
超级会员免费看
订阅专栏 解锁全文
10

被折叠的 条评论
为什么被折叠?



