首先,让我们来看一下“hive having”和“条件查询效率”的概念是什么。在Hive中,HAVING子句用于对GROUP BY子句中的分组进行过滤,而条件查询效率是指在查询过程中如何提高效率,减少不必要的计算。在Hive中,where可以针对字段来进行条件查询,但是where无法针对聚合结果进行条件查询;如果需要对聚合结果进行条件查询,那么此时需要使用having
having的使用必须在group by后面,前面是where。在SQL中增加 HAVING 子句原因是,WHERE 关键字无法与聚合函数一起使用。
select name from table group by name having min(score) > 90;
在 Hive 中,HAVING 和 WHERE 是用于过滤查询结果的两个关键字。HAVING 用于对分组后的结果进行过滤,而 WHERE 则用于对表中的数据进行过滤。在使用这两个关键字时,我们要注意对查询效率的优化,以提高查询速度和减少资源消耗。
例子1 数据工资 gongzi.txt
1 wjm 8000
1 tom 5000
1 mmm 4000
2 wjm 90000
2 tom 6000
2 mmm 12900
建表语句:
create table gongzi (month int,name string,money double) row format delimited fields terminated by ' ';
加载数据:
load data local inpath '/gongzi.txt' into table gongzi ;
获取平均工资超过6000的员工:
SET hive.cbo.enable = FALS