31、Power BI 中高级数据仓库概念及 Dataflows 入门

Power BI 中高级数据仓库概念及 Dataflows 入门

1. SCD 类型 2(SCD 2)

当企业需要保留员工的历史和当前数据时,SCD 2 类型可用于在数据仓库中保留数据变更历史。在 SCD 2 场景中,我们必须根据业务需求维护历史数据。通常,每当事务系统发生更改时,我们会在数据仓库中插入新的数据行,这会导致数据仓库中出现数据重复,因此不能使用源表的主键作为维度的主键。为此,需要引入新的列集:
- 代理键列 :确保“客户”维度中行的唯一性,该键是代表数据仓库维度中存储的每行数据的索引,与源系统的主键(业务键或备用键)不同。
- 开始日期和结束日期列 :表示一行数据处于当前状态的时间范围。
- 状态列 :显示每行数据的状态。

以员工变动场景为例,如 Brian Welcker 辞职、Stephen Jiang 晋升为销售副总裁、Roger Hamilton 被聘为新的北美销售经理,在数据仓库中会有如下更改:
1. 更新 Brian Welcker 在数据仓库中 DimEmployee 表的最后一条记录,将结束日期设为 2012 年 4 月 30 日,将 CurrentFlag 更新为 0,并将状态列的值更改为 null。
2. 更新 Stephen Jiang 在数据仓库中 DimEmployee 表的最后一条记录,将结束日期设为 2012 年 4 月 30 日,将 CurrentFlag 更新为 0,并将状态列的值更改为 null。
3. 为 Stephen Jiang 插入一条新记录,反映他的新职位、基本工资、上级员工键

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值