MySQL - 进阶篇 - 3.3 ORDER BY 优化

原创已于 2025-10-11 16:09:45 修改 · 781 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #数据库

于 2025-10-11 16:01:53 首次发布

MySQL - 进阶篇 - 3.3 ORDER BY 优化

一、前言

在 MySQL 中，排序操作是查询优化的关键环节之一。ORDER BY 能显著影响查询性能，尤其在数据量较大或无索引支持的场景下。
MySQL 执行排序的方式主要分为两种：

Using filesort
表示通过表的索引或全表扫描读取数据行后，再在内存排序缓冲区（sort_buffer）中进行排序。所有不是通过索引直接返回有序结果的情况，都属于 Filesort 排序。
Using index
表示直接利用有序索引顺序扫描返回排序结果，无需额外排序操作。这种方式效率高、性能稳定。

显然，Using index 性能优于 Using filesort。
在优化排序操作时，我们的目标就是——尽可能让查询使用索引顺序扫描（Using index）。

二、实验准备

A. 删除已有索引

首先，删除之前为 tb_user 表创建的部分索引：

drop index idx_user_phone on tb_user;
drop index idx_user_phone_name on tb_user;
drop index idx_user_name on tb_user;

执行后，tb_user 表上只保留主键索引，其余普通索引被清空。

三、执行排序 SQL

B. 按 age 排序

explain select id, age, phone from tb_user order by age;

结果显示：

Extra: Using filesort

此时，由于 age 没有索引，MySQL 需要从表中读取所有行数据，再在排序缓冲区中进行排序，性能较低。

C. 按 age, phone 排序

explain select id, age, phone from tb_user order by age, phone;

依旧出现：

Extra: Using filesort

原因同上，两个字段均无索引，仍需文件排序。

四、创建联合索引

create index idx_user_age_phone_aa on tb_user(age, phone);

此时再次执行：

explain select id, age, phone from tb_user order by age, phone;

结果变为：

Extra: Using index

说明 MySQL 可以直接通过索引顺序扫描返回结果，无需额外排序。
性能提升显著。

五、升序与降序排序分析

E. 根据 age, phone 进行降序排序

explain select id, age, phone from tb_user order by age desc, phone desc;

此时出现：

Extra: Using index; Using Backward index scan

解释：
Backward index scan 表示“反向扫描索引”。
因为默认索引的叶子节点是按升序排列的，当查询按降序排序时，MySQL 会逆向扫描索引。
在 MySQL 8.0 及以上版本中，已支持创建降序索引，因此我们也可以针对这种场景显式创建降序索引。

F. 根据 phone, age 进行升序排序

explain select id, age, phone from tb_user order by phone, age;

结果为：

Extra: Using index; Using filesort

原因分析：
创建索引时字段顺序为 (age, phone)，而排序时顺序为 (phone, age)，不满足最左前缀法则。
因此，索引无法被完全利用，只能部分使用，最终仍出现 filesort。

F（续）。根据 age, phone 一个升序一个降序

explain select id, age, phone from tb_user order by age asc, phone desc;

结果：

Extra: Using filesort

原因：
创建索引时，默认排序为升序。当一个字段升序、另一个字段降序时，索引顺序与查询不完全匹配，因此无法利用索引顺序，只能使用 filesort。

六、优化方案：创建升降序联合索引

为解决上述问题，我们创建一个混合排序的联合索引：

create index idx_user_age_phone_ad on tb_user(age asc, phone desc);

执行验证：

explain select id, age, phone from tb_user order by age asc, phone desc;

结果：

Extra: Using index

此时查询完全走索引，无需额外排序操作。

七、升序/降序联合索引结构示意

age asc, phone asc：

18 → 20 → 23 → 27 → 33 → 38 → 60

age asc, phone desc：

18 → 20 → 23 → 27 → 33 → 38 → 60
         ↓     ↓     ↓     ↓
         phone 值按降序排列

八、ORDER BY 优化总结

根据以上测试，我们得出以下优化原则：

根据排序字段建立合适的索引
多字段排序时，也要遵循最左前缀法则，字段顺序必须与索引定义一致。
尽量使用覆盖索引（Using index）
这样可以避免回表，进一步减少 I/O 开销。
混合升降序排序需匹配索引规则
当一个字段升序、一个字段降序时，创建索引时应明确指定 (ASC / DESC)。
无法避免的 filesort 场景
在大数据量排序中，可适当调大排序缓冲区：
```
set sort_buffer_size = 1M;
```
默认值为 256K。

理解

一、理论理解

ORDER BY 是 MySQL 查询优化器中最容易引发性能瓶颈的操作之一。它的本质是从数据层到执行层的双重排序问题。
在没有索引支持的情况下，MySQL 必须对结果集执行额外的内存排序操作（Using filesort），而一旦数据量超过 sort_buffer_size，排序操作将溢出到磁盘，代价成倍增加。

从底层机制看，Using filesort 的执行路径大致分为以下三步：

收集排序键值：扫描表记录，将参与排序的字段提取出来；
排序缓冲区排序：在内存的 sort buffer 中进行快速排序（通常是双路归并或堆排序算法）；
返回结果集：如果排序数据量过大，MySQL 会分块排序并进行多路归并，这时 I/O 成本极高。

相反，Using index 则代表一种“天然有序”的访问方式。
它依赖于 B+ 树索引本身的顺序性，在遍历叶子节点时，数据已经是按键值排列的，因此不再需要额外的排序过程。
这正是为什么在同样的 ORDER BY 查询下，Using index 的性能可以比 Using filesort 高出数十倍的根本原因。

由此可见，排序优化的核心在于两点：

让排序尽可能走索引（利用索引的天然有序性）
若无法避免 filesort，则最小化排序代价（通过缓冲区优化与字段约束）

当涉及多字段排序时，MySQL 依旧遵循“最左前缀法则”：

索引从第一个字段起，必须连续匹配到排序字段，否则索引失效。

例如索引 (age, phone)，仅当 ORDER BY age 或 ORDER BY age, phone 时可完全利用索引；
若反转为 ORDER BY phone, age，则索引失效，退化为 Using filesort。

而当一个字段升序、一个字段降序时（如 ORDER BY age ASC, phone DESC），MySQL 默认索引方向为升序，无法完全匹配，此时也会退化为文件排序。
除非在 MySQL 8.0 及以上版本中，显式创建带方向性的联合索引 (age ASC, phone DESC)，方可实现 Using index。

简而言之：

索引的“有序性”是排序优化的灵魂。
一旦字段顺序、方向、类型与索引定义不一致，MySQL 将失去方向感，只能退回到笨重的文件排序。

二、大厂实战理解（BAT、字节、Google、OpenAI、NVIDIA）

在大厂级数据库优化实践中，排序优化往往不是“语法调优”，而是架构级的系统调优。
尤其当表级数据量达到千万级以上时，排序的代价不仅影响响应时间，更直接影响缓存命中率与磁盘吞吐。
以下是几个典型的企业级实战维度：

（1）BAT 视角：索引设计即查询设计

阿里、腾讯的 DBA 体系强调“索引即接口”思想。
即每一个高频查询的排序字段都必须在索引层被显式建模。
在表结构设计阶段，DBA 会对常用的 ORDER BY 模式（如时间、热度、权重）建立对应的复合索引。
这种“预排序”思维在广告系统、Feed 流系统中尤为重要，因为任何一次 filesort 都意味着数百万级记录的磁盘归并。

（2）字节跳动视角：冷热分区与索引覆盖

字节内部在 推荐系统 与 数据分层缓存 中大量使用冷热数据分区 + 局部索引覆盖策略。
举例：在 ORDER BY created_at DESC LIMIT 20 这类场景下，常将最近 N 天数据单独拆分为热表（带降序索引），以保证 Using index；
而旧数据则通过异步归档。
这种方式在字节内部的 视频流推荐 Feed 中被称为“时间窗口索引分层”，极大减少了 filesort。

（3）Google & OpenAI 视角：执行层优化与内存调度

Google 的 CloudSQL 和 OpenAI 的 RAG Pipeline 系统在执行层强调sort buffer 自适应调优。
在任务执行层面，当检测到文件排序占比过高（出现大量临时表和外部归并），会自动扩充 sort_buffer_size 或进行多线程分区排序。
这种动态调度机制使排序过程可以在不增加索引的前提下保持稳定的延迟性能。
换句话说，他们把排序当成“可预测的内存事件”，而不是“偶发的性能灾难”。

（4）NVIDIA 视角：硬件层面的反向索引优化

NVIDIA 内部数据库团队在处理 GPU 任务日志与事件数据排序时，倾向于使用**反向扫描索引（Backward Index Scan）**作为一种“反序遍历加速”。
即利用 B+Tree 的倒序扫描特性，直接返回最新的若干记录，而不依赖 filesort。
例如按时间降序查询最新日志，这一策略几乎无 I/O 开销。
在 MySQL 8.0 之后，这种“物理层反序扫描”已成为标准特性。

大厂面试题

🧠 面试题 1：

在 explain 结果中出现 Using filesort，意味着什么？它与 Using index 的根本区别是什么？

参考答案：
Using filesort 表示 MySQL 需要在额外的排序缓冲区中进行排序操作，而非直接利用索引的有序结构。执行流程包括扫描数据、取出排序字段、放入 sort buffer 排序后再输出结果。
Using index 表示查询直接利用了索引的物理顺序返回有序数据，不需要再额外排序。
根本区别在于：

Using filesort 是逻辑层的排序（需要计算与内存/磁盘参与）
Using index 是物理层的顺序扫描（几乎无额外代价）
在性能上，前者随数据量增长近似 O(n log n)，而后者接近 O(n)。

🧠 面试题 2：

为什么 ORDER BY phone, age 无法复用索引 (age, phone)？请结合最左前缀法则解释。

参考答案：
因为联合索引 (age, phone) 的有序性是按 age → phone 建立的，即索引的第一维度是 age。
当排序字段顺序变为 (phone, age) 时，第一排序维度不再匹配索引的最左字段，导致索引顺序被破坏。
MySQL 只会使用索引的连续前缀部分进行排序扫描，因此 (phone, age) 违反最左前缀法则，
索引无法被有效利用，只能退化为 Using filesort。
换言之，MySQL 的索引并非“任意字段可逆序”，而是“从最左开始的连续有序前缀”。

🧠 面试题 3：

在 MySQL 8.0 以前和 8.0 以后，ORDER BY age DESC 的执行机制有什么不同？

参考答案：

MySQL 8.0 以前：
不支持真正的“降序索引”，所有索引默认都是升序的。
当 ORDER BY age DESC 时，MySQL 会进行 Backward Index Scan（反向扫描索引叶节点），性能略低于正向扫描，但仍优于 filesort。
MySQL 8.0 及以后：
支持显式声明降序索引（CREATE INDEX idx_age_desc ON tb_user(age DESC)）。
这样，ORDER BY age DESC 将直接使用物理降序索引扫描，不再依赖反向遍历，
性能进一步提升，尤其在联合索引混合方向时。

🧠 面试题 4：

为什么在 ORDER BY 中出现“一个字段升序、一个字段降序”会导致 Using filesort？如何优化？

参考答案：
因为 MySQL 默认建立的索引方向是升序，而当排序条件中存在混合方向（如 ORDER BY age ASC, phone DESC），
索引的整体顺序无法与查询顺序完全一致，索引失效。
优化方法是创建方向一致的联合索引：

create index idx_user_age_phone_ad on tb_user(age asc, phone desc);

这样 MySQL 就能直接按该索引结构顺序扫描返回结果，
Using filesort 消失，变为 Using index。
此技巧在 MySQL 8.0 之后尤为常用。

🧠 面试题 5：

ORDER BY 排序性能瓶颈除了索引缺失，还有哪些系统层面的影响因素？
请从内存、磁盘与执行计划角度分析。

参考答案：
除了索引设计问题外，影响排序性能的因素主要包括：

排序缓冲区大小 (sort_buffer_size)
决定是否能在内存中完成排序。缓冲不足会触发多路归并，产生临时文件，显著增加 I/O。
临时表存储引擎
若排序需写入临时表，InnoDB 与 Memory 引擎的效率差异明显；InnoDB 临时表会产生更多磁盘访问。
分页操作 (LIMIT offset, size)
在大偏移量分页下，即使索引排序有效，仍需扫描大量无用数据，可通过索引覆盖或子查询优化。
执行计划误判
当统计信息不准时，MySQL 优化器可能错误选择 filesort 而非 index scan。可通过 ANALYZE TABLE 更新统计信息修正。

大厂场景题

🧩 场景题 1：阿里电商系统——商品列表排序性能告警

背景：
阿里某电商项目中，商品搜索接口 /api/v1/goods/list 默认按上架时间倒序展示，SQL 语句如下：

select id, name, price, created_at
from tb_goods
where status = 1
order by created_at desc
limit 20;

数据库表 tb_goods 数据量超过 8000 万行，慢查询日志显示：

Sort_merge_passes > 10
Extra: Using filesort

请求耗时 3.4 秒。

问题分析：
created_at 没有建立索引，导致全表扫描 + 文件排序。
而分页 + 倒序意味着 MySQL 必须扫描全部数据后再取 TOP N，这种“从海量数据中挑最新”极度低效。

优化思路：

建立降序索引：

create index idx_goods_created_desc on tb_goods(created_at desc);

改写分页逻辑为“基于游标”的索引翻页：

select id, name, price, created_at
from tb_goods
where status = 1 and created_at < '2025-10-11 00:00:00'
order by created_at desc
limit 20;

结果复盘：
explain 显示：

Extra: Using index; Backward index scan

查询耗时从 3.4 秒降至 0.03 秒，性能提升约 110 倍。
阿里 DBA 总结此类场景为：倒序分页必走时间索引，否则等价于“全表归并”。

🧩 场景题 2：字节跳动推荐系统——Feed 流排序不稳定问题

背景：
字节内部某视频推荐 Feed 系统，每次推荐数据按算法得分（score）排序：

select video_id, title, score
from tb_feed
where user_group = 'A'
order by score desc, publish_time desc
limit 50;

表中已存在联合索引 (score, publish_time)，但运维监控发现部分查询仍出现：

Extra: Using filesort

问题分析：
尽管索引存在，但查询中的 user_group = 'A' 破坏了最左前缀匹配原则。
MySQL 优化器判断 user_group 的过滤性更强，因此优先走该字段索引，导致排序阶段回退至 filesort。

解决方案：

重建复合索引，覆盖过滤与排序字段：

create index idx_feed_group_score_time on tb_feed(user_group, score desc, publish_time desc);

使用 EXPLAIN 验证执行路径，确认 Extra 为 Using index。

结果复盘：
执行时间从 520ms 降至 8ms。
字节 DBA 在内部最佳实践中将此称为：

“在 ORDER BY 中，排序字段要紧跟过滤字段，否则 MySQL 优化器会放弃最优路径。”

🧩 场景题 3：Google CloudSQL 日志平台——多字段排序的方向冲突

背景：
Google CloudSQL 团队在日志聚合平台中，执行以下查询：

select id, event_type, created_at, priority
from tb_logs
order by created_at asc, priority desc
limit 100;

现象：
Extra: Using filesort
查询响应从几十毫秒变为上百毫秒。

问题分析：
联合索引 (created_at, priority) 为默认升序，而排序中一个升序、一个降序，方向不一致。
MySQL 无法利用索引物理顺序，只能执行全量排序。

解决方案：

创建带方向性的联合索引：

create index idx_logs_created_priority on tb_logs(created_at asc, priority desc);

结果复盘：
排序模式由 Using filesort → Using index，延迟从 123ms 降至 7ms。
Google CloudSQL 团队将此类优化归纳为：

“联合索引不仅是字段顺序问题，更是方向一致性问题（Order Direction Consistency）。”

🧩 场景题 4：OpenAI 日志回放系统——跨日数据分页排序延迟

背景：
OpenAI 内部任务审计系统用于按任务结束时间降序显示最近执行的 500 条日志。
SQL 语句如下：

select task_id, model_name, end_time, latency
from tb_task_logs
where end_time > '2025-10-01'
order by end_time desc
limit 500;

表中数据量 1.5 亿条，且存在大量跨日数据。
系统监控到该查询 I/O 使用率高达 98%，CPU 飙升。

问题分析：
虽然 end_time 有索引，但排序涉及范围过滤（> 条件），使 MySQL 需回表取完整行，
且排序结果集过大，触发多次外部归并。
最终 Extra 同时出现：

Using where; Using filesort

优化策略：

覆盖索引：仅查询必要字段，避免回表。

alter table tb_task_logs add index idx_endtime_latency(end_time desc, latency);

排序缓冲区优化：
```
set global sort_buffer_size = 4M;
```
分页游标优化：
将传统分页替换为基于上次 end_time 的游标翻页。

结果复盘：
CPU 降至 12%，磁盘 I/O 恢复至稳定状态。
OpenAI 工程团队在复盘文档中记录：

“排序优化的关键不是减少排序字段，而是减少排序数据量。”

🔍 总结性启示

从四个场景可以抽象出 ORDER BY 优化的工程范式：

优化策略	典型场景	核心思想
降序索引	时间倒序分页（阿里）	让数据“从时间轴的尾端开始读”
过滤字段前置索引	多条件排序（字节）	保证最左前缀匹配不被破坏
方向一致性索引	多字段升降混合（Google）	索引必须与 ORDER BY 方向匹配
覆盖索引 + 游标分页	大数据窗口查询（OpenAI）	减少排序数据量 + 避免回表