Hive分析窗口函数 GROUPING SETS、GROUPING__ID

本文介绍了Hive中的GROUPING SETS和GROUPING__ID,这两个函数常用于OLAP分析,提供不同维度的统计。GROUPING SETS允许自定义分组组合,而GROUPING__ID则标识了每个结果属于哪个分组集合。通过示例展示了GROUPING SETS的使用,以及GROUPING__ID如何表示不同维度组合。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

目录

1.概述

2.数据准备

2.1数据格式

2.2创表语句

3.GROUPING SETS和GROUPING__ID

3.1 GROUPING SETS 例1

3.1.1查询语句

3.1.2等价于

3.1.3查询结果

3.1.4 结果说明

3.2 GROUPING SETS 例2

3.2.1 查询语句

3.2.2 等价于

3.2.3 查询结果

3.3 GROUPING__ID 解释



1.概述

GROUPING SETS,GROUPING__ID,CUBE,ROLLUP

这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时、天、月的UV数。

2.数据准备

2.1数据格式

2015-03,2015-03-10,cookie1
2015-03,2015-03-10,cookie5
2015-03,2015-03-12,cookie7
2015-04,2015-04-12,cookie3
2015-04,2015-04-13,cookie2
2015-04,2015-04-13,cookie4
2015-04,2015-04-16,cookie4
2015-03,2015-03-10,cookie2
2015-03,2015-03-10,cookie3
2015-04,2015-04-12,cookie5
2015-04,2015-04-13,cookie6
2015-04,2015-04-15,cookie3
2015-04,2015-04-15,cookie2
2015-04,2015-04-16,cookie1

2.2创表语句

use cookie;
drop table if exists cookie5;
create table cookie5(month string, day string, cookieid string) 
row format delimited fields terminated by ',';
load data local inpath "/home/hadoop/cookie5.txt" into table cookie5;
select * from cookie5;

3.GROUPING SETS和GROUPING__ID

说明:在一个GROUP BY查询中,根据不同的维度组合进行聚合,等价于将不同维度的GROUP

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值