数据仓库

博客围绕数据流转、分层、表同步、数据库设计范式、建模方案等数据库相关内容展开,还涉及维度退化、业务数据库导入等知识。同时介绍了用户行为指标、GMV指标、转化率等指标的定义及计算方法,以及拉链表的生成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据如何流转的?
 提示:架构图
复制代码
为什么要进行分层?分了哪几层?每层的作用是什么?
表如何分类?分别使用什么同步方案?具体如何实现同步?
 提示:实体表、维度表、事务事实表、周期事实表,全量、增量、更新+新增
复制代码
数据库设计三范式是什么?
 提示: 列不能再分,不存在部分依赖和传递依赖
复制代码
数据仓库OLAP使用哪种建模方案?业务数据库OLTP使用哪种建模方案?
 提示:关系建模 VS 维度建模
复制代码
维度建模有几种常见模型?
 提示:星型模型、雪花模型、星座模型
复制代码
业务数据库如何导入?导入哪种格式?
 提示:sqoop,text,可以支持orc,sqoop参数
复制代码
为什么要进行维度退化?如何进行维度退化?
 提示:减少Join
复制代码
用户行为指标有哪些?如何计算?
 提示:活跃、新增、留存、流失、回流、沉默、连续活跃
复制代码
GMV指标是什么?如何计算?
转化率指标是什么?如何计算?
漏斗模型是什么?如何计算?
品牌复购率是什么?如何计算?
拉链表是什么?如何生成?
 提示:通过关系型数据库的create time和update time获取数据的新增和变化,用临时表解决了Hive中数据不能更新的问题。复制代码

转载于:https://juejin.im/post/5d09a221f265da1b667bdea4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值