
数据仓库
文章平均质量分 88
HanseyLee
这个作者很懒,什么都没留下…
展开
-
fast note
note原创 2022-09-22 23:23:30 · 221 阅读 · 1 评论 -
一种基于SparkSQL的Hive数据仓库拉链表缓慢变化维(SCD2+SCD1)的示例实现
背景 Hive 实现缓慢变化维,没有使用事务表的更新和删除操作(最新版本Hive已经支持,但需要Server/Client做相应配置,Hive实现的事务还有一定的局限性) Hive 自身的SQL使用MapReduce引擎,速度慢,这里使用SparkSQL实现 参考: 准备基础维度表 base_dim 业务字段:id, name, city, st 维度表默认字段:sk, scd_upd...原创 2019-08-06 16:43:12 · 1809 阅读 · 0 评论