频繁超图挖掘:理论、算法与实验
频繁子超图挖掘问题概述
频繁超图挖掘问题类CFHM是传统频繁项集和图挖掘的自然扩展。然而,一般情况下,CFHM中的许多问题在输出多项式时间内无法解决,除非P = NP。在这种背景下,我们聚焦于频繁子超图挖掘问题,它是CFHM中的一个自然问题,可应用于诸多实际场景,如引文分析。
频繁子超图挖掘问题基于子超图同构的泛化关系。设$H_1, H_2 \in H$,若$H_2$有一个与$H_1$同构的子超图,则称$H_1$可通过子超图同构嵌入到$H_2$,记为$H_1 \preceq_i H_2$。我们考虑的问题是$(H, H_c, \preceq_i)$ - 频繁超图挖掘问题,即频繁子超图挖掘问题。
虽然该问题的模式语言限制为连通超图,但实际上任何枚举算法都可用于枚举频繁的、不一定连通的子超图。具体操作如下:
1. 设$\ell \in N$是一个未在集合$D \subseteq H$的任何超图中使用的标签。
2. 对于$D$中的每个超图$H$,引入一个新顶点$v$,用$\ell$标记它,并将$v$添加到$H$的每条边中。
3. 得到的超图的任何子超图都是连通的,并且唯一地表示$H$的一个(不一定连通)子超图。
负面结果
- 输出多项式时间不可解 :即使对于普通图(即2 - 均匀超图),频繁子超图挖掘问题在输出多项式时间内也是难解的。如果存在输出多项式时间算法来解决该问题,那么NP - 完全的哈密顿路径问题就可以在多项式时间内解决。
- 限制为无环超图仍NP - 难 :考虑将频繁
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



