大数据模式挖掘与延迟容忍网络的能量优化策略
在当今的科技领域,大数据处理和网络通信是两个备受关注的领域。在大数据处理中,频繁模式挖掘算法对于从海量数据中提取有价值的信息至关重要;而在网络通信方面,延迟容忍网络(DTN)由于其节点的移动性和间歇性连接特性,面临着能量消耗和消息传递效率的挑战。本文将深入探讨大数据模式挖掘算法以及DTN中的能量优化策略。
1. 大数据频繁模式挖掘算法 - MR-FPM
在大数据环境下,传统的频繁模式挖掘算法如SPAM和PrefixSpan在处理大规模数据集时面临着效率问题。为了解决这个问题,提出了基于MapReduce的频繁模式挖掘算法(MR-FPM)。
1.1 Support Calculator阶段
在Support Calculator阶段,支持计算器算法中的Mapper接收上一阶段的输入数据,并按照算法3的描述,在各个节点上统计每个候选模式的局部频率。Mapper生成的输出是 <候选模式, 节点特定支持度> 对。之后,具有相同候选模式的集合会被传输到同一个Reducer。Reducer将每个模式的各个支持度相加,生成给定时间段内的最终频繁模式。最后,随着时间t + t’ 新数据的到来,这个过程会重复进行。
graph LR
A[上一阶段输入数据] --> B[Mapper]
B --> C{<候选模式, 节点特定支持度>对}
C --> D[Reducer]
D --> E[最终频繁模式]
F[新数据t + t'] --> A
超级会员免费看
订阅专栏 解锁全文
1617

被折叠的 条评论
为什么被折叠?



