维护数据库质量的新度量方法
1. 引言
数据库的质量可通过其是否满足完整性约束来衡量,违反这些约束则意味着质量不佳。过去,我们已了解如何利用完整性约束来建模、度量和监控数据库中信息的质量,以及如何识别、计算和度量完整性违规的情况与原因,以控制数据的一致性。
在此基础上,我们进一步提出了新的完整性违规度量方法,这些方法不仅能更精细地评估数据质量,还可用于不一致容忍的完整性检查(ITIC)和完整性修复。
2. 框架
2.1 数据库、补全、更新与约束
- 基本概念 :
- 原子 :形式为 $p(t_1, …, t_n)$ 的表达式,其中 $p$ 是 $n$ 元谓词($n \geq 0$),$t_i$ 可以是常量或变量。
- 文字 :原子 $A$ 或取反的原子 $\sim A$。
- 数据库子句 :形式为 $A \leftarrow B$ 的全称闭公式,其中 $A$ 是原子(头),$B$ 是文字的可能为空的合取(体)。若 $B$ 为空,$A$ 为事实;若 $B$ 不为空,$A \leftarrow B$ 为规则。
- 数据库 :有限的数据库子句集合。若数据库子句体中无取反原子,则该数据库为确定的。
- 补全 :设 $comp(D)$ 表示数据库 $D$ 的补全,
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



