1.分组
分组是把类似的行组织在一起的一种方式。在结果集中每一行都是一个组。
组是非空的,每一个可以在结果集中显示的组都至少包含一个记录。每个组都与结果集中的其他组不同。对组内进行统计的count操作绝对不为0. 针对null值进行分组的时候,必须要做额外的处理来规避。在分组操作中,要对分组的标量中存在null值的情况做处理,最好分组的列都是非null值。对于select列表中的项,如果没有把它当做聚集函数的参数使用,那么它必须是组的一部分。例如:
select deptno ,count(*) from dept group by deptno;
2.窗口
窗口操作是聚集函数与over的联合使用。例如:
select deptno,count(*)over() from emp order by deptno;
当然窗口允许处理一行的多层聚集。在实际执行过程中,窗口函数都是最后一步执行,而且仅仅位于order by之前。
3.分区
使用partition by子句预定义行的分区或组,以完成聚集。它创建的组在结果集中并不是独特的,与order by的独特性有区别。使用分区操作,每一个记录都包含了所在分组的聚集操作值,而不是像order by一样,只能是汇总的结果集。
4.null的作用
聚集函数会忽略null值,确切的说聚集函数只计算非null值。
5.可读性+性能=威力
这里的SQL要做平衡,联接查询和聚集操作,这是一个额外的选择。一般来说,每一个查询问题都有多种解决思路,如何选取需要仔细权衡。