问题导读
1.GROUPING SETS与另外哪种方式等价?
2.根据GROUP BY的维度的所有组合进行聚合由哪个关键字完成?
3.ROLLUP与ROLLUP关系是什么?
GROUPING SETS,GROUPING__ID,CUBE,ROLLUP
这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时、天、月的UV数。
Hive版本为 apache-hive-0.13.1数据准备
数据准备:
2019-03,2019-03-10,cookie1 2019-03,2019-03-10,cookie5 2019-03,2019-03-12,cookie7 2019-04,2019-04-12,cookie3 2019-04,2019-04-13,cookie2 2019-04,2019-04-13,cookie4 2019-04,2019-04-16,cookie4 2019-03,2019-03-10,cookie2 2019-03,2019-03-10,cookie3 2019-04,2019-04-12,cookie5 2019-04,2019-04-13,cookie6 2019-04,2019-04-15,cookie3 2019-04,2019-04-15,cookie2 2019-04,2019-04-16,cookie1 CREATE EXTERNAL TABLE zcg1234 ( month STRING, day STRING, cookieid STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' stored as textfile location '/tmp/zcg1234/'; hive> select * from zcg1234; OK 2019-03 2019-03-10 cookie1 2019-03 2019-03-10
|