聚类:理论与实践中的半监督与度量学习
1. 半监督层次聚类
半监督层次聚类的研究最初聚焦于凝聚式层次聚类。层次聚类可行性问题(FHC)定义为:给定度量空间中的一组对象 $Z$,以及对象间的必连(must - link)、勿连(cannot - link)和 $\epsilon$ 约束,是否存在一个满足所有这些条件的聚类?
FHC 问题被证明是 NP 完全的。为了证明这一点,我们通过将 OPL(另一个问题)归约到 FHC 来进行。给定 OPL 的一个实例 $I$,它包含一组变量 $U$ 和一个子句集 $C$。我们构造 FHC 的一个实例 $I’$:
- 为 $U$ 中的每个变量 $u_i$ 创建一个节点 $z_i$($1\leq i\leq n$),对于 $U - {u_{i1}, u_{i2}, \cdots, u_{ir}}$ 中的每个 $u$ 创建一个单例簇 ${z}$。
- 对于每个节点 $z_{iq}$($1\leq q\leq r$):
- 设 $C_k = {C_{j1}, \cdots, C_{jp}}$ 是变量 $u_{ik}$ 出现的子句集。对于 $C_k$ 中的每个子句 $C_j = (u_{j1} \vee u_{j2} \vee u_{j3})$:
- 创建一个由三个与 $C_j$ 关联的主节点组成的集合 $A_j = {w_{j1}, w_{j2}, w_{j3}}$。
- 创建六个额外的次节点 $a_1^j, a_2^j, b_1^j, b_2^j, c_1^j, c_2^j$,其中 $B_j = {a_1^j, b_1^j, c_1^j}$,$a_2^j, b_2^j, c_2^j$ 分别是 $a_1^j, b_1^j,
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



