- 博客(2)
- 收藏
- 关注
原创 最近14天内连续3天购买(断两天也算连续)的用户
话不多说,直接上题目 有一个订单表,里面装载的是各个用户的下单信息,表结构如下 create table orders ( id string, order_date string ) row format delimited fields terminated by ','; 数据如下 这里的最近14天内指的是"2020-03-07" ~ "2020-03-20" 1.请统计最近14天内连续3天购买的用户,以及连续购买的最大天数 2.请统.
2021-09-29 10:48:48
783
1
原创 hive中的缓慢变化维之拉链表
一、前言 数据仓库中数据的同步策略: 1)增量同步:增量同步适用于那些数据量比较大,并且之前的数据不发生变化的数据,储存的是新增加的数据; 2)全量同步:存储的是所有的数据,适用于那些数据量不是很大但是每天都会发生变化的数据,在数据仓库中,如果按照天进行分区,那么每个分区储存的数据就是截止到当天分区的所有的数据,此时要想查询所有数据的话只需要查询当前最新一天分区数据即可; 3)新增及变化同步:存储创建时间和操作时间都是今天的数据,适用于那些数据量比较大,既会有新增也会有变化的数据; 4)特殊同步策
2021-09-23 15:28:56
1007
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人