独立函数依赖的数量研究
1. 引言
在数据库设计与开发的过程中,完备性和明确性是评价结果的两个主要标准。完备性要求找出所有必须指定的约束,而明确性是提供推理系统的必要条件。然而,完备性受到人类审视大量约束集和理解所有可能的约束交互的能力的限制。这一问题不仅影响了数据库设计的效率,还对数据库的维护复杂性和算法可行性产生了重要影响。
2. 研究问题
在一个具有 n 个属性的数据库中,独立函数依赖的最大数量问题是一个重要的理论问题。具体而言,我们要探讨的是不遵循 Armstrong 公理且无法使用 Armstrong 公理从其他依赖中推导出的依赖系统的最大基数。这类问题的研究有助于我们更好地理解和优化数据库设计中的约束管理。
2.1 现有构造方法
目前,一个简单且长期以来被认为是最佳的构造方法是:取尽可能多的属性子集,使得没有一个子集包含另一个子集(根据 Sperner 的著名定理,这些子集的数量是 ( \binom{n}{n/2} ),并让它们全部决定所有进一步的值。这种方法虽然直观,但在实际应用中可能并不是最优解。
2.2 新的构造方法
通过一个特定的构造方法,可以给出超过 ( \binom{n}{n/2} ) 个独立依赖(该构造将给出 ( (1 + \frac{1}{n^2}) \binom{n}{n/2} ) 个),而上限是 ( 2^n - 1 ),大约是 ( \sqrt{n} \binom{n}{n/2} )。这一新的构造方法不仅提高了独立函数依赖的数量,也为数据库设计提供了更多的灵活性。
3. 背景与意义
在数据库设计与开发过程中,完备性和