数据仓库维度表技术全面解析
1. 维度表基础技术
1.1 维度表结构
维度表具有单一主键列,该主键作为外键嵌入到关联的事实表中,为事实表行提供描述性上下文。维度表通常是宽而扁平的非规范化表,包含许多低基数文本属性。操作代码和指标可视为属性,但最强大的维度属性应使用详细描述填充。维度表属性是查询和商业智能(BI)应用中约束和分组规范的主要目标,报表上的描述性标签通常是维度属性域值。
1.2 维度代理键
维度表设计为使用一列作为唯一主键,不能使用操作源系统的自然键,因为随着时间变化跟踪时,一个自然键可能对应多个维度行。此外,维度的自然键可能由多个源系统创建,这些自然键可能不兼容或管理不善。数据仓库/商业智能(DW/BI)系统应控制所有维度的主键,为每个维度创建匿名整数主键,即维度代理键。这些代理键是简单整数,从 1 开始顺序分配。日期维度是个例外,它可以使用更有意义的主键,如 YYYYMMDD 格式的整数。
1.3 自然键、持久键和超自然键
操作源系统创建的自然键受 DW/BI 系统无法控制的业务规则影响。例如,员工编号(自然键)可能会因员工辞职后重新入职而改变。当数据仓库需要为员工提供单一键时,必须创建持久且不变的持久键,有时也称为持久超自然键。最好的持久键格式应独立于原始业务流程,通常是从 1 开始顺序分配的简单整数。虽然随着员工资料的变化,可能会有多个代理键与员工关联,但持久键永远不会改变。
1.4 向下钻取
向下钻取是业务用户分析数据的最基本方式,即在现有查询中添加行标题。新行标题是 SQL 查询中 GROUP BY 表达式追加的维度属性,该属性可以来自查询中与
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



