数据仓库维度建模技术全解析
1. 维度表基础技术
1.1 维度表结构
维度表通常有一个单一的主键列,该主键会作为外键嵌入到相关的事实表中,以确保维度行的描述性上下文与事实表行精确匹配。维度表一般是宽而扁平的非规范化表,包含许多低基数的文本属性。操作代码和指标可作为属性处理,但最有效的维度属性应使用详细的描述进行填充。维度表属性是查询和商业智能(BI)应用中约束和分组规范的主要目标,报表上的描述性标签通常就是维度属性的域值。
1.2 维度代理键
维度表设计时需有一列作为唯一主键,但不能使用操作系统的自然键。因为随着时间推移,当跟踪变化时,一个自然键可能对应多个维度行。此外,维度的自然键可能由多个源系统创建,这些自然键可能不兼容或管理不善。数据仓库/商业智能(DW/BI)系统需要控制所有维度的主键,因此应为每个维度创建匿名整数主键,即维度代理键。这些代理键是简单的整数,从 1 开始按顺序分配,每次需要新键时递增。不过,日期维度是个例外,它可以使用更有意义的主键,如表示 YYYYMMDD 的整数。
1.3 自然键、持久键和超自然键
由操作源系统创建的自然键受 DW/BI 系统无法控制的业务规则影响。例如,员工编号(自然键)可能在员工辞职后重新入职时发生变化。当数据仓库需要为该员工使用单一键时,就必须创建一个持久键,即持久超自然键。最好的持久键格式应独立于原始业务流程,通常为从 1 开始按顺序分配的简单整数。尽管随着员工信息的变化,可能会有多个代理键与之关联,但持久键永远不会改变。
1.4 向下钻取
向下钻取是业务用户分析数据的最基本方式,即在现有查询中添加行标题。新的行标
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



