数据分析中的查询探索
1. 数据分析基础概念
在数据分析里,查询集合的结构十分关键。若知晓部分查询的答案,就能够计算出其他查询的答案。为达成这一目标,需要明确哪些查询可用于计算给定查询的答案。这里假定查询集合 Q 存在结构,并且可以对查询进行运算,这也是查询语言常见的特性。
在查询计算中,仅假定存在一个运算符 ⊗,它仅在语法层面操作,不考虑查询在数据集上的结果。例如,在常见示例中,Q = P(I),⊗ = ∪。
通过假定运算符 ⊗,也隐含假定了 Q 上存在一组可能数量庞大的等式,如 q = q1 ⊗ q2。同时,假定 Q 具有与 ⊗ 相关的代数结构,具体为一个具有交换性和幂等性的幺半群结构,即查询幺半群。
查询幺半群的定义如下:
- ∀q1, q2 ∈ Q : q1 ⊗ q2 ∈ Q;
- ∀q1, q2, q3 ∈ Q : q1 ⊗ (q2 ⊗ q3) = (q1 ⊗ q2) ⊗ q3;
- ∃e ∈ Q ∀q ∈ Q : e ⊗ q = q ⊗ e = q;
- ∀q1, q2 ∈ Q : q1 ⊗ q2 = q2 ⊗ q1;
- ∀q ∈ Q : q ⊗ q = q。
幺半群中的表达式集合记为 EQ。常见示例里,以 ∅ 作为单位元,显然是一个查询幺半群。
查询幺半群结构带来两个重要概念:
- 表达式的标准形式 :若假定 Q 中元素存在字典序 ≺,则 EQ 中的表达式有标准形式,即表达式中不出现 e,且任意一对 qij 和 qik 满足 qij ≺l qik ↔ j < k。
- 生成元
超级会员免费看
订阅专栏 解锁全文
1697

被折叠的 条评论
为什么被折叠?



