数据仓库 - 拉链表开发实践

一、什么是拉链表

拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。

二、拉链表开发

案例:客户数据拉链表

2x01 表设计

存储介质
T_CUSTOMER MySQL
ODS_T_CUSTOMER HIVE
TMP_CUSTOMER MPP
DIM_CUSTOMER MPP

操作系统数据表:T_CUSTOMER

字段 类型 备注
cid int 主键
name varchar  
phone_number varchar  
create_date date  
update_date date  

 

ODS数据表:ODS_T_CUSTOMER (全量记录操作系统数据表的历史快照)

字段 类型 备注
cid int  
name varchar  
phone_number varchar  
create_date date  
update_date date  
sync_date date 同步日期

临时数据表:TMP_CUSTOMER

** 根据ODS_T_CUSTOMER的sync_date字段抽取全量最新数据(包括新增,修改的数据)

字段 类型 备注
cid int 主键
name varchar  
phone_number varchar  
create_date date  
update_date date  

数仓维度表:DIM_CUSTOMER

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值