图对象的半监督聚类:子图挖掘方法
在图对象聚类领域,挖掘具有区分性的子图特征是一项关键挑战。本文将详细介绍一种基于子图挖掘的半监督聚类方法,涵盖子图特征挖掘、聚类算法以及实验验证等方面。
半监督子图挖掘
在图对象聚类问题中,首要挑战是如何基于约束和无约束图挖掘出具有区分性的子图特征。由于子图数量随图规模呈指数增长,枚举所有子图模式既不可行也无必要。
为解决这一问题,我们将子图特征挖掘问题转化为优化问题:
[T^ = \arg\max_{T \subseteq S} \Psi(T) \text{ s.t. } |T| \leq t]
其中,(\Psi(T)) 是评估子图特征子集 (T) 有用性的目标函数,(T^ ) 是最优子图特征集,(|T|) 表示子图特征集 (T) 的大小,(t) 是我们使用的最大特征数。
目标函数
在定义目标函数 (\Psi) 时,我们同时考虑约束和无约束图对象。通过假设约束的一致性,从给定的约束集 (M_0) 和 (C_0) 中推断额外的约束。
目标函数应满足以下几个方面:
- 必须链接(Must-link) :每对属于 (M_0) 的图对象 ((G_i, G_j)) 应彼此接近。
- 不能链接(Cannot-link) :每对属于 (C_0) 的图对象 ((G_i, G_j)) 应彼此远离。
- 可分离性(Separability) :无约束图对象应彼此分离。过于频繁或过于罕见的子图特征无用,因为在这样的特征空
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



