外部内存扫描式天际线算法研究
1. 算法概述
外部内存天际线算法可分为三类:
- 扫描式算法 :对数据集进行多次扫描,使用小窗口候选对象来修剪被支配对象。可进一步分为有预处理和无预处理两种方法。
- 无预处理 :直接按对象存储或生成顺序处理,如 BNL 和 RAND 算法。
- 有预处理 :在天际线计算前或同时对对象进行外部排序,如 SFS 和 LESS 算法。还有 SaLSa 算法,类似 SFS 并引入提前终止输入文件扫描的条件;SOAD 算法,类似 SFS 但对不同属性集使用不同排序函数。
- 索引式算法 :使用各种索引引导天际线点搜索并修剪大部分空间。如 BBS 算法使用 R - 树,在该索引下 I/O 最优;NN 算法也使用 R - 树进行多次最近邻搜索;Bitmap 算法使用位图结构编码输入数据;Index 算法使用多个 B - 树按维度索引数据;还有一些方法使用空间填充曲线和一维索引;LS 算法为低基数域构建专门数据结构。
- 分区式算法 :将初始空间划分为多个分区。如 D&C 算法采用分治范式计算天际线对象;近期提出的 OSP 算法递归分区天际线点以减少不可比点之间的检查;BSkyTree 算法在分区空间时同时考虑支配和不可比性概念。
2. 算法流程
- LESS 算法 :
- 识别最低熵对象 oh。
- 进行顺序窗口遍
超级会员免费看
订阅专栏 解锁全文
2763

被折叠的 条评论
为什么被折叠?



