零售业预测

分析方法

架构导图

b66a9291c58942c7a94b7a256eab34de.png

背景

1886c71760c149d994add0b010634852.png

8a16e6a91a9044e9b449962d6bcd4688.png

117d742414004d4d9aa04630bcd47190.png

注意库存表

left join 主表, 将没有库存的数据也整合到一起

33589e80985b435f868e9ffc56cb6424.png30197bb7e5734d94b7eabf733a49da30.png选当天时间

关联

5567599084444be2bfa87d5457b668d6.png

两个事实表

指标

fa4d2b6ee5f54dd1a671026c2a5dde30.png

b6922b56ee5b461686c371d64ef22dd9.png9ef89f81fdc14275a13055483571dd5e.png 如果销量平均值是小数,则向上取整 3.5→4

日报

干了什么

进度多少

有没有难题?

任务完成没

如何确定最细粒度?

select * from table where=一个或多个字段,通过这个条件看是否有唯一的一条数据,如果没有重复数据,那么这个where条件后的字段就是最细粒度

最细粒度的作用?

保证数据是唯一的,比如表连接时,on后面的条件为最细粒度,那么这两个表就是一对一连接,如果不是最细粒度,就是一对多连接

ODS

b5f695bb3f48405596421cbac900c271.png

数据的清洗转换 

去重

  • group by 
  • distinct 
  • row_number()over(partition by 有重复数据的字段 )

空值

  • 主键空值 , 一般是 删除 该条数据
  • 其他列空值, 一般会根据开发文档的要求去处理, 将 空格   'NULL' 等字符串列 转换成  null 值 数值型 一般转换成  0 

不规范数据 :

  • 身份证号
  • 手机号
  • 邮箱
  • IP     

码值的转换       

  • 支付码值
  • 性别            
  • 国家
  • 币种

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值