受限聚类:现状与新趋势
受限聚类基础
受限聚类中,链接约束是指对象之间的必须链接(must - link)和不能链接(cannot - link)约束。可以通过以下公式计算满足约束与违反约束的比例:
[q_{link}(R_i) = \frac{1}{n_r} \sum_{j = 1}^{n_r} v(R_i, l_j)]
其中,(n_r) 是对象之间的约束数量,(l_j) 是必须链接或不能链接约束,若 (R_i) 满足约束 (l_j),则 (v(R_i, l_j) = 1),否则为 0。这些约束可以从类标签约束中提取,例如,属于同一簇的对象对可创建必须链接约束,属于不同簇的对象对可创建不能链接约束。
交互式和增量受限聚类
挑战
在受限聚类中,存在诸多科学挑战,具体如下:
- 处理大规模约束集的算法设计 :
- 减少模型大小:通过采样或识别无关对象,限制考虑的元素数量。
- 减少约束数量且不损失质量:对约束或受约束对象进行采样;识别约束类别并研究搜索策略。
- 放宽解的最优性:使用执行时间阈值,但不能保证结果质量。
- 采用局部搜索而非全局搜索。
- 约束数量的限制与增量方法 :理想情况下定义最小约束集,并使用增量方法让用户提供这样的集合。
以下是处理大规模约束集的挑战及应对方法的表格总结:
|挑战|应对方法|
| ---- | ---- |
|设计处理大规模约束集的算法|减少模型大小、减少约束数量、放宽解的最优性、采用局部搜索|
|限制约束数量并使用增量
超级会员免费看
订阅专栏 解锁全文

2278

被折叠的 条评论
为什么被折叠?



