18、维度表设计中的层次结构、雪花模式与外扩表应用解析

维度表设计中的层次结构、雪花模式与外扩表应用解析

1. 重复组问题在维度表设计中的体现

在维度表设计里,重复组属性是常见挑战。当维度表存在一组多次出现的属性,或者这些属性出现在多个维度表中时,就可能引发关于行长度和一致性的问题。

例如,在销售代表(salesrep)表中,每个销售代表有两个重要的办公地点:工作地点和汇报地点。描述办公地点需要十个属性,这就导致这些属性重复出现。另外,与销售代表相关的重要日期也有两组重复属性,一组是入职日期,另一组是上次绩效评估日期,每个日期关联十九个属性,且都需重复两次。

随着属性数量增加,表的行长度会变宽,这可能带来技术问题。而且,大量重复属性还会给ETL过程带来风险,比如重复列内容填充的一致性、不同ETL程序对重复属性处理的一致性等。

2. 外扩表的引入及作用

当行长度或ETL一致性问题无法通过其他方法解决时,可考虑使用外扩表。外扩表是一种有限形式的雪花模式,它将重复属性放在一个单独的表中,并为该表赋予自己的代理键。在原维度表中,被迁移的属性会被一个或多个指向外扩表的外键引用所替代。

以销售代表维度表为例,可以构建两个外扩表。将描述工作地点和汇报地点的十个属性移到一个单独的位置表(LOCATION)中,该表有一个名为location_key的代理键。这样,销售代表维度表中就不再有20个位置属性,而是包含两个指向位置表的外键引用,分别对应工作地点和汇报地点。同样,两组日期属性被一对day_keys替代,分别对应入职日期和上次绩效评估日期。

3. 外扩表的使用及影响

使用外扩表时,查询包含多个角色外扩表的模式需要使用别名技术。可以通过SQL、视图或报表工具的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值