近期,因统计分析、数据处理的工作需求,经常使用Hive SQL,因此记录遇到的一些问题。
1、desc formatted 表名
----确定表的信息(行、列、存储路径),在确定Hive 数据仓库中表的存储路径时,很有帮助。
2、SQL GROUP BY 两个字段
group by 一般和聚合函数一起使用才有意义,比如 count sum avg等,使用group by的两个要素:
(1) 出现在select后面的字段 要么是是聚合函数中的,要么就是group by 中的.
(2) 要筛选结果 可以先使用where 再用group by 或者先用group by 再用having
例子
表;
Table
: Subject_Selection