GriMa:用于基于网格包分类的网格挖掘算法
1. GriMA算法概述
GriMA算法遵循标准的频繁子图挖掘程序,以深度优先递归的方式探索所有规范代码的搜索空间。其具体步骤如下:
1. 计算所有频繁边。
2. 对每个频繁扩展调用Extend函数。Extend函数以一个频繁且规范的模式代码P作为输入参数,输出所有以P为前缀的频繁规范代码P’。为实现这一目标,它首先计算网格数据库D中P的所有出现的所有可能的有效扩展集合E,有效扩展是指边的代码e,使得P.e在D中出现。最后,对每个使得P.e频繁且规范的扩展e递归调用Extend函数,在每次递归调用中,模式逐渐增长。
2. 节点诱导的GriMA
在实际应用中,节点有标签而边无标签(所有边具有相同标签),因此设计了节点诱导的GriMA(node-induced-GriMA)变体,用于计算节点诱导的网格,即由节点集诱导的网格。这对应于图上的“节点诱导”闭包运算符,给定模式P,在不添加新节点的情况下向P添加所有可能的边。实验表明,这种优化减少了提取的模式数量和提取时间。
3. GriMA的性质和复杂度
GriMA具有正确性和完整性。正确性意味着它只输出频繁子网格,完整性意味着它不会遗漏任何频繁子网格。设k为输入网格集D中的网格数量,n为D中最大网格Gi的边数,|P|为模式P的边数。GriMA以每个模式P的$O(kn^2\cdot|P|^2) = O(kn^4)$时间枚举所有频繁模式,相比FreqGeo和MaxGeo有显著的时间复杂度提升,后者每个模式的时间复杂度为$O(k^2n^4\cdot\ln n)$。
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



