16、GriMa：用于基于网格包分类的网格挖掘算法

Linux

于 2025-09-07 16:01:29 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏：结构与统计模式识别前沿文章标签： GriMA 节点诱导的GriMA 频繁子图挖掘

本文链接：https://blog.youkuaiyun.com/linux/article/details/153807870

结构与统计模式识别前沿专栏收录该内容

63 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

GriMa：用于基于网格包分类的网格挖掘算法

1. GriMA算法概述

GriMA算法遵循标准的频繁子图挖掘程序，以深度优先递归的方式探索所有规范代码的搜索空间。其具体步骤如下：
1. 计算所有频繁边。
2. 对每个频繁扩展调用Extend函数。Extend函数以一个频繁且规范的模式代码P作为输入参数，输出所有以P为前缀的频繁规范代码P’。为实现这一目标，它首先计算网格数据库D中P的所有出现的所有可能的有效扩展集合E，有效扩展是指边的代码e，使得P.e在D中出现。最后，对每个使得P.e频繁且规范的扩展e递归调用Extend函数，在每次递归调用中，模式逐渐增长。

2. 节点诱导的GriMA

在实际应用中，节点有标签而边无标签（所有边具有相同标签），因此设计了节点诱导的GriMA（node-induced-GriMA）变体，用于计算节点诱导的网格，即由节点集诱导的网格。这对应于图上的“节点诱导”闭包运算符，给定模式P，在不添加新节点的情况下向P添加所有可能的边。实验表明，这种优化减少了提取的模式数量和提取时间。

3. GriMA的性质和复杂度

GriMA具有正确性和完整性。正确性意味着它只输出频繁子网格，完整性意味着它不会遗漏任何频繁子网格。设k为输入网格集D中的网格数量，n为D中最大网格Gi的边数，|P|为模式P的边数。GriMA以每个模式P的$O(kn^2\cdot|P|^2) = O(kn^4)$时间枚举所有频繁模式，相比FreqGeo和MaxGeo有显著的时间复杂度提升，后者每个模式的时间复杂度为$O(k^2n^4\cdot\ln n)$。

4. 实验设置

会员秒杀 ¥9.9 重磅福利

超级会员免费看