hive
LafreeBing泉
慎独
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive 求五分钟之内访问次数达到100次的用户
字段有 userid dt(timeStamp) url (10亿pv量) 求黑名单 求五分钟之内访问次数达到100次的用户 离线思路: dt - lag(dt,100) over(distribute by userid sort by dt asc)<五分钟 实时思路: 滑动窗口函数 ...原创 2018-12-25 09:55:23 · 2706 阅读 · 0 评论 -
hive 级联求和 窗口函数
Hive窗口函数LAG案例替换级联求和 需求: 原始数据: A,2015-01,5 A,2015-01,15 B,2015-01,5 A,2015-01,8 B,2015-01,25 A,2015-01,5 A,2015-02,4 A,2015-02,6 B,2015-02,10 B,2015-02,5 1、表的创建和加载: create table t_access_times(usernam...原创 2019-02-23 19:08:33 · 938 阅读 · 0 评论
分享