大型数据库中的厚天际线挖掘
在数据库查询领域,天际线操作符(skyline operator)近年来备受关注。它能返回在多维空间中,不被其他对象在某些度量上所支配的对象。不过,现有的天际线操作大多只能给出“薄天际线”,也就是单个对象,这在一些实际应用中可能无法满足需求。接下来,我们将详细介绍一种新的概念——厚天际线(thick skyline),以及相关的挖掘算法。
1. 天际线操作符简介
在查询回答中,天际线操作符是一个新的热门关注点。给定一组对象,天际线指的是那些不被其他任何对象支配的对象。若对象 A 在所有维度上都与对象 B 一样好或更好,且至少在一个维度上更优,那么就称对象 A 支配对象 B。
以酒店为例,假设我们关注酒店到海滩的距离(Distance)和价格(Price)这两个维度,天际线酒店就是那些在这两个维度综合表现最优的酒店。用 SQL 语句可以这样表示天际线查询:
SELECT * FROM Hotels WHERE city='New York' SKYLINE OF Price min, Distance min;
这里的 min 表示要最小化价格和距离这两个属性。为了简化,我们假设在所有维度上都基于最小化条件来计算天际线,但实际上也可以结合其他条件,如最大化。
2. 现有天际线查询工作的局限性
目前,大多数关于天际线查询的研究都聚焦于在大型数据库中高效计算天际线对象。然而,这些结果可能无法为用户提供足够令人满意的信息。
比如,会议组织者在选择会议地点时
超级会员免费看
订阅专栏 解锁全文
4058

被折叠的 条评论
为什么被折叠?



