一、拉链表是什么?
数仓建立过程中,在有些情况下,为了保持历史的一些状态,需要用拉链表来做,这样做目的在可以保留所有状态的情况下可以节省空间。
拉链表,是记录每条记录的生命周期,通常记录中需要一个状态变化来展示,如果一个状态结束,那么就重新开始一条记录
所以,拉链表原始记录需要:
1.记录需要有 状态变化
2.记录需要有创建时间和操作时间
拉链表需要新增两个字段:状态开始时间和状态结束时间
二、适用范围
拉链表适用于,数据会发生变化,但是大部分是不变的(实际是以运算换取存储空间)
拉链表反应的是数据的变化
三、制作流程
1.图示形成过程

2.制作过程
建立拉链表

使用第一天的数据初始化拉链表

建立临时拉链表

把变化的数据和拉链表做一个计算和union

拉链表是一种在数据仓库中用于记录数据状态变化的技术,它通过保存每个记录的状态开始和结束时间来节省存储空间。当数据发生少量变化时,拉链表能反映这些变化。制作拉链表涉及将变化数据与原表合并,通过更新状态结束时间来跟踪记录的生命周期。这种方法适用于数据大部分不变但需保留历史状态的情况。
最低0.47元/天 解锁文章

2561

被折叠的 条评论
为什么被折叠?



