6.2 Hive分组统计：GROUP BY与聚合函数

原创已于 2025-11-28 09:46:44 修改 · 350 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Hive #分组统计 #聚合函数

于 2025-11-27 11:48:57 首次发布

Hive数据仓库实践专栏收录该内容

26 篇文章

订阅专栏

文章目录

1. 实战概述
2. 实战步骤
3. 实战总结

1. 实战概述

本次实战围绕 Hive 的 GROUP BY 与聚合函数展开，基于学生表 t_student 进行多维度分组统计，包括按性别、年龄统计人数，使用 HAVING 筛选分组结果，并计算各性别的平均、最大和最小年龄，全面展示了分组聚合在数据汇总与分析中的核心应用。

2. 实战步骤

在这里插入图片描述

3. 实战总结

本次 Hive 分组统计实战围绕学生表 t_student，系统演练了 GROUP BY 与常用聚合函数的结合使用。通过按性别、年龄分组，完成了人数统计、平均年龄计算及最值分析，并借助 HAVING 子句实现对聚合结果的二次过滤（如筛选人数超过2的性别组）。所有查询均符合语法规则，验证了“非聚合字段必须出现在 GROUP BY 中”的约束机制。实验过程中，Hive 正确生成 MapReduce 任务完成聚合计算，体现了其对结构化数据分析的良好支持。整个过程不仅巩固了分组统计的核心语法，也强化了对执行逻辑（先 WHERE 过滤、再 GROUP BY 分组、最后 HAVING 筛选）的理解，为后续复杂报表开发和数据洞察奠定了坚实基础。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

酒城译痴无心剑 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。