Hive中with cube、with rollup、grouping sets用法

SQL分组详解

最新推荐文章于 2025-07-18 22:04:00 发布

原创最新推荐文章于 2025-07-18 22:04:00 发布 · 1.6w 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#数据 #hive

Hive 专栏收录该内容

2 篇文章

订阅专栏

本文详细解析了SQL中cube、rollup及groupingsets三种分组方式的区别与应用场景，通过具体的表结构与数据示例，展示了不同分组方式的查询语句与结果，帮助读者更好地理解和运用这些SQL特性。

表结构

CREATE TABLE test (f1 string,
                   f2 string,
                   f3 string,
                   cnt int) ROW FORMAT delimited FIELDS TERMINATED BY '\t' stored AS textfile;
LOAD DATA LOCAL inpath '/data/logs/suiyingli/tmp/test.data' overwrite INTO TABLE test;

原始数据

•A A B 1

•B B A 1

•A A A 2

with cube查询语句

SELECT f1,
       f2,
       f3,
       sum(cnt),
       GROUPING__ID,
       rpad(reverse(bin(cast(GROUPING__ID AS bigint))),3,'0')
FROM test
GROUP BY f1,
         f2,
         f3 WITH CUBE;

with cube结果范例

rollup查询语句

SELECT f1,
       f2,
       f3,
       sum(cnt),
       GROUPING__ID,
       rpad(reverse(bin(cast(GROUPING__ID AS bigint))),3,'0')
FROM test
GROUP BY f1,
         f2,
         f3 WITH ROLLUP;

rollup结果范例

grouping sets查询语句

SELECT f1,
       f2,
       f3,
       sum(cnt),
       GROUPING__ID,
       rpad(reverse(bin(cast(GROUPING__ID AS bigint))),3,'0')
FROM test
GROUP BY f1,
         f2,
         f3
GROUPING sets((f1),(f1,f2))

grouping sets结果范例