键约束下一致性查询回答的数据复杂性综述
1. 动机
不确定性以多种形式和表示方式出现,本文采用一种非常基础的不确定性表示方法,通过主键违规来建模关系数据库模型中的不确定性。
1.1 不确定数据库相关概念
- 块(Block) :是同一关系中主键相同的最大元组集合,同一块中的元组相互排斥,每个块中只有一个元组为真,但我们不知道是哪一个。
- 不确定数据库 :指可能违反主键约束的数据库,例如会议规划数据库中,关于ICDT 2016的举办城市(罗马或巴黎)、KDD的排名(A或B)以及ICDT的举办频率(两年一次或每年一次)存在不确定性。
- 数据库不确定的原因 :
- 积极方面 :可以表示多种可能的未来场景,如ICDT 2016有两个候选举办城市。
- 消极方面 :可能是数据集成不可避免的结果,不同网站的数据集成可能导致矛盾。
- 修复(Repair) :从每个块中恰好选择一个元组得到不确定数据库的一个修复(或可能世界)。一般来说,不确定数据库的修复数量与数据库大小呈指数关系,例如包含n个每个有两个元组的块的不确定数据库,有2^n个修复。
1.2 查询语义
对于不确定数据库上的布尔查询q,有三种自然的语义:
- 可能性语义 <
超级会员免费看
订阅专栏 解锁全文
3953

被折叠的 条评论
为什么被折叠?



