图挖掘、社交网络分析与多关系数据挖掘
1. 引言
在当今的数据处理领域,频繁项集挖掘和序列模式挖掘已经有了广泛的研究和应用。然而,许多科学和商业应用需要挖掘比频繁项集和序列模式更复杂的模式,这些模式涉及树、格、图、网络等复杂结构。图作为一种通用的数据结构,在建模复杂结构及其交互方面变得越来越重要,广泛应用于化学信息学、生物信息学、计算机视觉等多个领域。因此,图挖掘成为数据挖掘中一个活跃且重要的主题。
2. 图挖掘基础
2.1 图挖掘的重要性
图在建模复杂结构方面具有重要作用,如电路、图像、化学化合物等。随着对大量结构化数据分析需求的增加,图挖掘的重要性日益凸显。频繁子结构是图挖掘中最基本的模式,可用于表征图集、区分不同图组、对图进行分类和聚类等。
2.2 频繁子图的基本概念
- 图的表示 :用 (V(g)) 表示图 (g) 的顶点集,(E(g)) 表示边集,标签函数 (L) 将顶点或边映射到标签。
- 子图同构 :若存在从图 (g) 到 (g’) 的子图同构,则 (g) 是 (g’) 的子图。
- 支持度 :给定标记图数据集 (D = {G_1,G_2,\cdots,G_n}),支持度 (support(g))(或频率 (frequency(g)))定义为 (D) 中 (g) 作为子图的图的百分比(或数量)。
- 频繁图 :支持度不低于最小支持阈值 (min sup) 的图称为频繁图。 </
超级会员免费看
订阅专栏 解锁全文
2692

被折叠的 条评论
为什么被折叠?



