数据分组
分组允许将数据分为多个逻辑组,以便能够能够对每个组进行聚集计算。
创建分组
分组是在SELECT语句的GROUP BY子句中建立的。
输入:SELECT vend_id ,COUNT(*) AS num_prods
FROM products
GROUP BY vend_id;
输出:
分析:GROUP BY子句指示MySQL按vend_id排序并分组数据。这导致COUNT()是对每个vend_id计算num_prods一次而不是对整个表。所以,供应商1001有3个产品。
GROUP BY指示MySQL对数据分组,然后对每个组而不是整个结果集进行聚集;
注意:
1.GROUP BY子句可以包含任意数目的列,这使得能对分组进行嵌套,为数据分组提供更细致的控制;
2.如果再GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。即,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据);
3.GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名;
4.除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出;
5.如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组;
6.GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前;
过滤分组
除了能用GROUP BY分组数据外,MySQL还允许过滤分组,规定包括哪些分组,排除哪些分组。
例如,可能想要列出至少有两个订单的所有顾客。为得出这种数据,必须基于完整的分组而不是个别的行进行过滤。
MySQL提供了HAVING子句。HAVING非常类似于WHERE。事实上,目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。
唯一的差别是WHERE过滤行,而HAVING过滤分组。
输入:SELECT cust_id, COUNT(*) AS orders
FROM orders
GROUP BY cust_id
HAVING COUNT(*) >=2;
输出:
分析:过滤COUNT(*) >=2(两个以上的订单)的那些分组;