数据库距离与XML功能依赖的阿姆斯特朗数据树研究
1. 数据库距离概念
在数据库研究中,引入了一种基于数据挖掘的数据库距离概念。该概念从给定模式R的实例r所满足的函数依赖集合出发,若两个数据库的属性数量相同且满足完全相同的函数依赖集合,则认为它们是相同的。
1.1 研究方向对比
- 本研究着重于探究两个数据库之间的差异程度。
- 而Müller等人从同步两个数据库所需的工作量角度探讨数据库距离,其方法更偏向算法,本研究则更具理论性。
1.2 研究步骤
- 确定最大距离 :首先确定了具有相同属性数量的两个数据库之间的最大可能距离。
- 计算任意距离 :通过证明两个数据库的距离是它们闭集集合的对称差的大小,确定了任意两个数据库的距离。
- 研究直径问题 :研究了具有给定(最小)键系统的数据库集合的直径,这引发了有趣的离散数学问题,例如给定超图H = (V, E),求不是最大子超图交集的完全子超图的数量。
1.3 研究成果与猜想
在普通图和k - 均匀超图中,当超边数量固定时,给出了较好的上界。并猜想若最小键是二元组集合,且键的数量为(\binom{n}{2} - \binom{a}{2})形式,则最大直径为2a - 2,当非键的二元组集合构成a个顶点的完全图时达到该最大值。
1.4 模型扩展方向
该距离概念仅考虑了函数依赖系统,存在