数据库中可能元组的完整性及信息质量的建模、测量与监控
可能元组数据库的完整性计算方法
在处理可能元组的数据库时,为了精确计算可能关系的完整性,介绍了三种直观的方法。
方法 1:α - 选择法
此方法基于 Tseng 引入的 α - 选择。α - 选择($\hat{\sigma} {\alpha}(R)$)会选择关系 $R$ 中属于该关系的概率 $p(t)_R$ 大于或等于 $\alpha$($\alpha \in [0, 1]$)的每个元组 $t$,即:
$\hat{\sigma} {\alpha}(R) = {t | t \in R \land p(t)_R \geq \alpha}$
若使用 α - 选择进行基于概率的元组过滤,所得子关系的完整性取决于 $\alpha$ 的值。$\alpha$ 越高,过滤的元组越多,完整性 $comp(\hat{\sigma} {\alpha}(R))$ 呈单调递减趋势。过滤后关系 $\hat{\sigma} {\alpha}(R)$ 的完整性始终大于或等于 $R_D$ 的完整性,且小于或等于忽略可能指示($\alpha = 0$)时 $R$ 的完整性。
- 个体元组概率情况 :若给定个体元组概率,对于每个 $\alpha$,应用 α - 选择可能会得到不同的子关系。此时,$\alpha$ 需在连续范围 $[0, 1]$ 内考虑,完整性 $comp’ {A1}(R)$ 可定义为 $comp(\hat{\sigma} {\alpha}(R))$ 关于 $\alpha$ 的积分:
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



