梯度LinClosure算法及其在关系数据分析中的作用
1. 引言
模糊逻辑是处理特定类型不精确性的形式框架。其核心思想是对真值采用分级方法,允许除0(假)和1(全真)之外的真值程度。例如,“彼得老了”这个命题可以被赋予0.8的程度,表示这个命题几乎是完全真实的。当处理多个分级属性时,我们通常需要确定它们之间的依赖关系。模糊属性蕴含(Fuzzy Attribute Implications,FAIs)就是表示数据集中分级属性之间特定依赖关系的规则,形式为“A ⇒ B”,意味着对于数据集中的每个对象,如果该对象具有A中的所有分级属性,那么它也具有B中的所有分级属性。
本文聚焦于现有算法的计算方面,介绍了LinClosure算法的扩展版本——梯度LinClosure(Graded LinClosure,GLinClosure)。与原始的LinClosure算法相比,GLinClosure更具通用性,且具有相同的渐近时间复杂度。由于数据表格中模糊属性的依赖关系与具有相似关系的域上的数据表格之间存在密切联系,GLinClosure还可用于计算具有相似关系的域上的数据表格中的函数依赖。
2. 预备知识和动机
2.1 模糊逻辑和模糊集理论
模糊逻辑和模糊集是基于一般的真值度结构发展起来的。本文使用的基本真值度结构是带套期(hedge)的完备剩余格,记为L = ⟨L, ∧, ∨, ⊗, →, ∗, 0, 1⟩,需满足以下条件:
- ⟨L, ∧, ∨, 0, 1⟩是一个完备格,0和1分别是L的最小和最大元素。
- ⟨L, ⊗, 1⟩是一个交换幺半群,即⊗是可交换、可结合的,且对于每个a ∈ L,有a ⊗ 1 = 1 ⊗ a =
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



