数据仓库中的事实表设计:快照、累积快照与无事实事实表
1. 快照和累积快照事实表
在数据仓库的事实表设计中,除了常见的事务事实表,还有周期性快照和累积快照这两种特殊类型。它们各自针对事务事实表设计难以有效应对的特定分析挑战而产生,具有独特的特点。
1.1 事务事实表
事务事实表用于跟踪事件,其粒度通常对应单个事务或事务的汇总。例如,在一个订单系统中,每一笔订单的详细信息(如订单号、商品信息、交易金额等)都可以记录在事务事实表中。然而,像余额、级别等状态类的事实,有时虽能从相关事务中计算得出,但过程往往效率不高,甚至在某些情况下根本无法计算。
1.2 快照事实表
快照事实表会在预定义的间隔内,对指定维度的余额、级别或状态进行采样。与事务事实表不同,快照事实表往往非常密集。
周期性快照中的余额或级别测量通常是半可加的,即在不同的快照周期内求和可能没有实际意义,在某些情况下甚至可能是不可加的。不过,快照可以包含周期开始和结束时的余额,以及能汇总该周期的完全可加事实,还可能包括用于计算平均余额或级别的总和。
以下是它们的特点对比表格:
| 事实表类型 | 跟踪内容 | 粒度 | 数据密度 | 事实可加性 |
| — | — | — | — | — |
| 事务事实表 | 事件 | 单个事务或汇总 | 较稀疏 | 部分可加 |
| 快照事实表 | 余额、级别、状态 | 预定义间隔采样 | 密集 | 半可加或不可加 |
1.3 累积快照事实表
对于代表一系列步骤或状态的业务流程,如果能轻松识别正在处理的项目,就可以设计累积
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



