数据仓库设计与管理:多维度数据模型解析
在数据仓库的设计过程中,不同类型的事实表和维度表有着各自独特的用途和设计思路。以下将详细介绍几种常见的数据模型及其设计要点。
周期性快照事实表的应用
在某些业务场景下,需要定期捕获收入、成本和利润率等数据,这时周期性快照事实表就派上了用场。例如,订阅销售事实表就采用了这种方式,它以固定的时间间隔记录相关数据。与产品销售事实表不同,订阅销售事实表并不用于记录具体的业务事件,所以不适合设计为事务型事实表。
业务需求中可能会要求根据年度收入和年度盈利能力每天计算订阅者的类别和等级。为了高效完成这一计算,可以将当天的客户订阅数据存储在单独的表中。因为在只包含当天数据的表上进行计算,比在包含数月或数年订阅数据的表上计算要快得多,而且由于当天的订阅数据已经存储在本地的DDS(数据仓库)中,并且年度收入和年度盈利能力已经计算好,所以也比查询源系统更快。
供应商绩效数据集市
供应商绩效数据集市的事实表粒度为每周每个供应产品一行,而不是每周每个供应商一行。这样的设计使得我们可以深入到产品级别进行分析,也可以汇总到供应商级别。该事实表属于周期性快照类型。
它除了日期维度外,还有一个周维度。周维度通过 week_key 引用,代表评估供应商绩效的周;日期维度通过 start_date_key 引用,即供应商开始向Amadeus Entertainment供应该产品的日期。周维度是基于日期维度创建的视图,通过限制特定日期过滤掉与周级别无关的列,并且与日期维度具有相同的键。
供应商绩效数据集市包含四个维度:日期、周、供应商和
超级会员免费看
订阅专栏 解锁全文
936

被折叠的 条评论
为什么被折叠?



