43、聚类:理论与实践中的半监督与度量学习

聚类:理论与实践中的半监督与度量学习

1. 半监督层次聚类

半监督层次聚类的研究最初聚焦于凝聚式层次聚类。层次聚类可行性问题(FHC)定义为:给定度量空间中的一组对象 $Z$,以及对象间的必连(must - link)、勿连(cannot - link)和 $\epsilon$ 约束,是否存在一个满足所有这些条件的聚类?

FHC 问题被证明是 NP 完全的。为了证明这一点,我们通过将 OPL(另一个问题)归约到 FHC 来进行。给定 OPL 的一个实例 $I$,它包含一组变量 $U$ 和一个子句集 $C$。我们构造 FHC 的一个实例 $I’$:
- 为 $U$ 中的每个变量 $u_i$ 创建一个节点 $z_i$($1\leq i\leq n$),对于 $U - {u_{i1}, u_{i2}, \cdots, u_{ir}}$ 中的每个 $u$ 创建一个单例簇 ${z}$。
- 对于每个节点 $z_{iq}$($1\leq q\leq r$):
- 设 $C_k = {C_{j1}, \cdots, C_{jp}}$ 是变量 $u_{ik}$ 出现的子句集。对于 $C_k$ 中的每个子句 $C_j = (u_{j1} \vee u_{j2} \vee u_{j3})$:
- 创建一个由三个与 $C_j$ 关联的主节点组成的集合 $A_j = {w_{j1}, w_{j2}, w_{j3}}$。
- 创建六个额外的次节点 $a_1^j, a_2^j, b_1^j, b_2^j, c_1^j, c_2^j$,其中 $B_j = {a_1^j, b_1^j, c_1^j}$,$a_2^j, b_2^j, c_2^j$ 分别是 $a_1^j, b_1^j,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值