Mysql group by top N的问题

本文介绍了两种方法在MySQL中实现Oracle ROW_NUM功能以查询分组前几名的数据,包括一种使用伪列的方式和另一种通过关联子查询的方法,并比较了它们在实际问题中的效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

   在日常工作中,经常要查询分组的前几名.oracle中可以通过row_num来支持查询,mysql暂时不支持row_num.那么如何来完成这个需求呢?

   例如:

表中的数据:

+--------+-------+-----+
| Person | Group | Age |
+--------+-------+-----+
| Bob    | 1     | 32  |
| Jill   | 1     | 34  |
| Shawn  | 1     | 42  |
| Jake   | 2     | 29  |
| Paul   | 2     | 36  |
| Laura  | 2     | 39  |
+--------+-------+-----+

期望的结果:

+--------+-------+-----+
| Shawn  | 1     | 42  |
| Jill   | 1     | 34  |
| Laura  | 2     | 39  |
| Paul   | 2     | 36  |
+--------+-------+-----+



   方式一:借鉴oracle中row_num的思想,在sql中增加伪列.

set @num := 0, @group := '';

select person, `group`, age
from 
(
   select person, `group`, age,
      @num := if(@group = `group`, @num + 1, 1) as row_number,
      @group := `group` as dummy
  from mytable
  order by `Group`, Age desc, person
) as x 
where x.row_number <= 2;
方式二:利用关联子查询

SELECT a.person, a.group, a.age FROM person AS a WHERE 
(SELECT COUNT(*) FROM person AS b 
WHERE b.group = a.group AND b.age >= a.age) <= 2 
ORDER BY a.group ASC, a.age DESC

ps:

1.在我处理的实际问题而言,方式一的效率明显高于方式二.

以上博客借鉴http://stackoverflow.com/questions/12113699/get-top-n-records-for-each-group-of-grouped-results.

  

### 如何在 MySQL 中实现分组 Top N 查询 #### 使用子查询结合 `LIMIT` 实现分组 Top N 查询 对于不支持窗口函数的 MySQL 版本,一种常见的方式是利用子查询配合 `LIMIT` 来获取各分组内的前几项记录。这种方法的核心在于构建一个嵌套查询结构,外部查询负责最终的结果展示,而内部查询则专注于按指定标准排序并截取所需数量的数据。 ```sql SELECT t1.* FROM table_name AS t1 JOIN ( SELECT group_column, MIN(id) as min_id FROM table_name GROUP BY group_column ) AS t2 ON t1.group_column = t2.group_column AND t1.id >= t2.min_id ORDER BY t1.group_column, t1.sort_column DESC LIMIT N; ``` 此代码片段展示了如何基于某个字段(`group_column`)进行分组,并选取每组内按照另一字段(`sort_column`)降序排列后的前N条记录[^3]。 #### 利用用户定义变量追踪排名位置 另一种策略涉及引入用户自定义变量来动态计算每一行在其所属分组中的相对位次。这种方式允许更灵活地控制筛选逻辑以及处理更为复杂的业务场景: ```sql SET @curGroup := ''; SET @rank := 0; SELECT * FROM( SELECT *, IF(@curGroup = group_column, @rank:=@rank+1, IF(@curGroup:=group_column, @rank:=1, @rank)) AS rank FROM table_name ORDER BY group_column ASC, sort_column DESC ) ranked_rows WHERE rank <= N; ``` 上述脚本首先初始化两个会话级别的变量——分别用来存储当前正在处理的分组标识符及其成员计数器;接着通过IF表达式更新这些变量的状态变化情况,从而达到为各行分配适当等级的目的;最后仅保留那些满足预设阈值条件(即不超过给定的最大排行数目)的项目作为输出结果集的一部分。 #### 执行顺序注意事项 值得注意的是,在编写任何类型的 SQL 查询之前都应该清楚了解各个组成部分之间的相互作用关系。根据已知的信息可知,MySQL 的默认解析流程遵循着一定的先后次序:首先是 `FROM` 和其下的连接操作,其次是 `WHERE` 进行初步过滤,随后才是 `GROUP BY` 完成分组统计工作,紧接着执行聚合运算与列的选择 (`SELECT`) ,再往后便是依据 `ORDER BY` 对整个集合实施全局性的排序安排,直至最后一刻才由 `LIMIT` 施加限制措施决定实际返回多少条目[^4]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值