数据流上并行天际线连接的高效算法
1. 引言
早期的天际线查询研究主要集中在单数据集上。但在一些应用中,天际线属性分布在多个数据集,于是出现了天际线连接查询。近年来,在数据流上计算天际线成为新趋势,不过目前只有一篇文献研究了多数据流上的天际线查询,且其算法采用串行范式,无法利用多核处理器。
本文研究多数据流上的并行天际线连接问题。改进了迭代框架,提出了新型迭代框架,挖掘其内在并行性,最终提出了两种基于滑动窗口的并行天际线连接算法:NP - SWJ 和 IP - SWJ。实验表明,这两种算法在真实数据集和合成数据集上都有出色表现。本文的贡献如下:
- 提出新型迭代框架,对迭代框架进行了改进。
- 提出两种并行天际线连接算法 NP - SWJ 和 IP - SWJ。
2. 相关工作
2.1 静态数据集上的天际线连接
- Jin 等人首次研究了天际线连接查询。
- Sun 等人提出了一种修剪连接空间的方法,并给出两种天际线连接查询算法。
- Jin 等人开发了用于等值连接天际线查询的非阻塞算法。
- Raghavan 和 Rundensteiner 提出了一种渐进式算法,可在多个抽象级别计算天际线连接查询,并在此基础上提出了 SKIN 框架。
- Bhattacharya 和 Teja 开发了几种高效算法,尽量在连接操作前对局部关系进行天际线查询。
- PrefJoin 是一个适用于多关系偏好感知连接查询的通用框架,也适用于天际线连接查询。
- Vlachou 等人提出了受 SFS 算法启发
超级会员免费看
订阅专栏 解锁全文
10

被折叠的 条评论
为什么被折叠?



