Power BI 中高级数据仓库概念及 Dataflows 入门
1. SCD 类型 2(SCD 2)
当企业需要保留员工的历史和当前数据时,SCD 2 类型可用于在数据仓库中保留数据变更历史。在 SCD 2 场景中,我们必须根据业务需求维护历史数据。通常,每当事务系统发生更改时,我们会在数据仓库中插入新的数据行,这会导致数据仓库中出现数据重复,因此不能使用源表的主键作为维度的主键。为此,需要引入新的列集:
- 代理键列 :确保“客户”维度中行的唯一性,该键是代表数据仓库维度中存储的每行数据的索引,与源系统的主键(业务键或备用键)不同。
- 开始日期和结束日期列 :表示一行数据处于当前状态的时间范围。
- 状态列 :显示每行数据的状态。
以员工变动场景为例,如 Brian Welcker 辞职、Stephen Jiang 晋升为销售副总裁、Roger Hamilton 被聘为新的北美销售经理,在数据仓库中会有如下更改:
1. 更新 Brian Welcker 在数据仓库中 DimEmployee 表的最后一条记录,将结束日期设为 2012 年 4 月 30 日,将 CurrentFlag 更新为 0,并将状态列的值更改为 null。
2. 更新 Stephen Jiang 在数据仓库中 DimEmployee 表的最后一条记录,将结束日期设为 2012 年 4 月 30 日,将 CurrentFlag 更新为 0,并将状态列的值更改为 null。
3. 为 Stephen Jiang 插入一条新记录,反映他的新职位、基本工资、上级员工键
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



