不完整数据的天际线查询计算
1. 相关工作
最初,天际线查询用于最大向量或帕累托集计算。天际线运算符最早由Borzsonyi等人引入数据库管理系统。不过,大多数现有的天际线算法只考虑整个数据集,并依赖于优势关系的传递性来获得显著的剪枝能力。由于优势关系具有非传递性和循环性,它们不能直接用于不完整数据的天际线查询。以下是几种处理不完整数据的天际线算法:
- 基于替换的算法 :Khalefa等人首次提出了用于不完整数据的天际线查询,即ISkyline算法。该算法使用了虚拟点和影子天际线的概念。计算每个桶的虚拟点,并用于与其他桶进行比较。影子天际线是未包含在桶的局部天际线中的项目列表,可通过支配候选天际线来减少比较次数。然而,该算法的性能受初始数据顺序的影响,且虚拟点并不总是能给出正确结果。
- 基于排序的算法
- SIDS算法 :Bharuka和Sreenivasa Kumar提出的排序天际线查询技术(SIDS)。若一个项目经过足够次数的处理,该算法会立即返回一个天际线点。输入数据按每个维度的非递增顺序进行预排序,然后依次移除被支配的项目。但增加列表数量可能会减慢天际线的生成速度。
- SCSA算法 :Gulzar等人提出的一种独特的混合算法(SCSA)。通过减少支配测试和搜索空间,从部分数据中生成天际线。但该算法未考虑不完整性的影响,有时结果不太实际。
- 基于表扫描的算法 :He和Han提出的基于表扫描的算法(TSI)。通过两个不同的步骤解决非传递性和循环优势问题。第一步通过顺序表扫
超级会员免费看
订阅专栏 解锁全文
118

被折叠的 条评论
为什么被折叠?



