Hive分析窗口函数深入(一) SUM,AVG,MIN,MAX

问题导读:
1、Hive分析窗口函数SUM如何实现?
2、Hive分析窗口函数AVG脚本如何编写?
3、Hive分析窗口函数MIN、MAX脚本如何实现?


Hive中提供了越来越多的分析函数,用于完成负责的统计分析。抽时间将所有的分析窗口函数理一遍,将陆续发布。
今天先看几个基础的,SUM、AVG、MIN、MAX。
用于实现分组内所有和连续累积的统计。


Hive版本为 apache-hive-0.13.1数据准备

CREATE EXTERNAL TABLE zcg1234 (
cookieid string,
createtime string, --day
pv INT
) ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
stored as textfile location '/tmp/zcg1234/';
 
desc zcg1234;


cookieid STRING
createtime STRING
pv INT
 
hive> select * from zcg1234;
OK
cookie1 2019-04-10 1
cookie1 2019-04-11 5
cookie1 2019-04-12 7
cookie1 2019-04-13 3
cookie1 2019-04-14 2
cookie1 2019-04-15 4
cookie1 2019-04-16 4

SUM — 注意,结果和ORDER BY相关,默认为升序

SELECT cookieid,
createtime,
pv,
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime) AS pv1, -- 默认为从起点到当前行
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS pv2, --从起点到当前行,结果同pv1
SUM(pv) OVER(PARTITION BY cookieid) AS pv3,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

掉进悬崖的狼

请博主喝杯奶茶

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值