动态关系网络中演化模式挖掘
在动态关系网络的研究中,挖掘演化模式是一个重要的课题。下面将详细介绍相关的挖掘方法和算法。
1. 挖掘锚点
挖掘频繁循环模式(CRMs)从定位满足CRM定义和相关限制的频繁锚点开始,具体步骤如下:
1. 排序与过滤 :给定动态网络 $N$,按顶点和边的标签频率对它们进行排序,移除所有不频繁的顶点和边,然后对剩余的顶点和边按频率降序重新标记。
2. 确定跨度序列 :确定每条边的跨度序列,若该序列至少包含一个与其他跨度标签不同的跨度,则列出该边的跨度序列。
3. 挖掘频繁跨度序列 :使用前缀跨度(prefixSpan)顺序模式挖掘技术确定所有频繁跨度序列。
4. 确定锚点 :将包含不同连续标签跨度的频繁序列视为锚点,频繁跨度序列中的跨度数量对应锚点中的模式总数。
2. CRM枚举
给定一个锚点 $c$,采用深度优先的方法,每次增加当前CRM的一条边来生成所需的CRM集合。为确保在深度优先探索中每个CRM只生成一次,使用了类似于gSpan算法的方法,并将其扩展用于CRM挖掘。
2.1 gSpan算法基础
gSpan以深度优先的方式探索频繁模式格。模式格是一个分层搜索空间,每个节点对应一个连通的频繁模式,最高节点为空模式(即单个顶点),下一级节点表示单边模式,依此类推。第 $n$ 级节点(表示 $n$ 边模式)比对应的 $(n - 1)$ 级节点多一条边。为确保模式格中的每个频繁模式只被访问一次,gSpan
超级会员免费看
订阅专栏 解锁全文
780

被折叠的 条评论
为什么被折叠?



