SQL必知必会(第四版)-10. 分组数据(GROUP BY,HAVING)

本文详细介绍了SQL中的GROUPBY、HAVING和ORDERBY子句,包括数据分组规则、过滤分组条件的应用,以及如何确保分组后的数据排序。通过实例演示了如何正确使用这些子句进行复杂查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

10.1 数据分组(GROUP BY)

10.2 过滤分组(HAVING)

1. 列出至少有两个订单的所有顾客

2. 列出具有两个以上产品且其价格大于等于4的供应商

正逻辑

反逻辑

TIP

10.3 分组和排序

ORDER BY与GROUP BY

例子

10.4 SELECT子句顺序


10.1 数据分组(GROUP BY)

GROUP BY子句指示DBMS按vend_id排序并分组数据。这就会对每个vend_id而不是整个表计算num_prods一次。

在使用GROUP BY子句前,需要知道一些重要的规定:

  • GROUP BY子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致地进行数据分组。(例子?)
  • 如果在GROUP BY子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。
  • GROUP BY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。(即,GROUP BY子句中出现的聚集函数,必须先在SELECT子句中定义好,有别名;但同时,GROUP BY子句中不能使用定义的别名)
  • 大多数SQL实现不允许GROUP BY列带有长度可变的数据类型(如文本或备注型字段)。
  • 除聚集计算语句外,SELECT语句中的每一列都必须在GROUP BY子句中给出。(??)
  • 如果分组列中包含具有NULL值的行,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
  • GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。

10.2 过滤分组(HAVING)

HAVING支持所有WHERE操作符。

1. 列出至少有两个订单的所有顾客

这条SELECT语句的前三行类似于上面的语句。最后一行增加了HAVING子句,它过滤COUNT(*) >=2(两个以上订单)的那些分组。

可以看到,WHERE子句在这里不起作用,因为过滤是基于分组聚集值,而不是特定行的值。

这里有另一种理解方法,WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。

2. 列出具有两个以上产品且其价格大于等于4的供应商

正逻辑

两个条件:1. 要求这个供应商有两个以上产品,2. 要求产品价格大于等于4。可以发现,第二个条件不是针对供应商的(是针对价格的),而我们的分组对象是供应商,所以第二个条件用WHERE实现,第一个条件用HAVING实现。

反逻辑

尝试只使用HAVING来完成过滤,如下图所示,必须在GROUP BY子句中加入prod_price语法才正确。

SELECT vend_id, COUNT(*) AS num_prods, prod_price FROM `Products` 
GROUP BY vend_id, prod_price HAVING COUNT(vend_id) >=2 AND prod_price >= 4;

该代码的输出为:

通过和之前的输出比较可以发现,只用HAVING的话有问题。这是因为,“GROUP BY vend_id, prod_price”分组会列出不同的prod_price,在这种情况下既满足具有两个以上产品和产品价格≥4,就需要prod_price正好相等。可以用如下代码的输入和输出来理解。输入:

SELECT vend_id, COUNT(*) AS num_prods, prod_price FROM `Products` 
GROUP BY vend_id, prod_price;

输出:

疑虑:在SELECT子句和HAVING子句中的COUNT()分别应该用什么形式?

TIP

HAVING与WHERE非常类似,如果不指定GROUPBY,则大多数DBMS会同等对待它们。不过,你自己要能区分这一点。使用HAVING时应该结合GROUP BY子句,而WHERE子句用于标准的行
级过滤。

10.3 分组和排序

ORDER BY与GROUP BY

我们经常发现,用GROUP BY分组的数据确实是以分组顺序输出的。但并不总是这样。

一般在使用GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。

例子

先看一下OrderItems这个Table,

若要检索包含三个或更多物品的订单号和订购物品的数目(物品指的是item):

要按订购物品的数目排序输出,需要添加ORDER BY子句,如下所示:

10.4 SELECT子句顺序

下面回顾一下SELECT语句中子句的顺序。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值