记一次mysql5.7的新特性derived_merge的坑

本文通过解决一道SQL面试题,详细讲解了如何在MySQL中正确使用GROUP BY和ORDER BY结合子查询获取每门课程最高分的学生,探讨了不同版本MySQL(如5.6与5.7)下衍生表合并机制对查询结果的影响。

       前段时间公司由于拖工资离职,拖了整整三个月了呀火大有木有,题主果断辞职,不跟他多bb。当然辞职后不免又到了找工作刷 面试题和写简历的尴尬阶段,总觉得很多很多面试题吧在工作中卵用没有,还非要每天无脑地背,没办法谁叫面试官就好这口。 当然这只是吐槽哈,小伙伴们别跟我一样有这个想法,我就是有点aggressive,这段时间面试题呀还有面试呀学到了很多知识点是真正工作中不能比的。 但是还是好累好累 | _ |,生活还是下手了。





      好了咱们进入正题(屏幕前的你:谁让你bb这么多的),-_-# 。 最近有个面试题呢是这样,要求使用 group by 分组得出记录里面最大的数(注意是一整行,而不是只要一列,只要一列当然max聚合函数就搞定了),那么咱举一个栗子:ps:这个表格的设计,emmmmmm,当然真正设计表不会这样设计,会出现冗余,如此设计只是方便阅读,因为就一张表


idstu_namecourse_namescore
1张三数学90
2李四语文94
3张三语文98
4李四数学97
5李四英语99
6张三英语100
      要求查询出各科分数最高的学生姓名,有的童鞋可能会这样写:

select stu_name,course_name,max(score) from tb_score group by course_name

      这样写就会导致一个问题也就是查询出来的各科最高分数可能不是那个学生的,结果如下:


      很明显数学得97分的压根就不是张三,这是为什么呢,group by 后的显示的列会只会根据所有组的第一行来显示,张三刚好在数学组的第一行,所以出来的是张三。



      当然有的童鞋知道了这个特性后知道该怎么做了,那就是 秘密武器 order by , 先排序,然后分数最高的肯定是所有组的第一行,那么 group by 后自然是取得这样行。ok, 按我们预定好的写一下这个sql(疯狂编写sql中… two hours later):

SELECT
   t.stu_name,
   t.course_name,
   max( t.score )
FROM
   ( SELECT stu_name, course_name, score FROM score ORDER BY score DESC ) t
GROUP BY
   t.course_name

      然后发现结果还是这样


      what the fuck???什么鬼,然后去查看mysql执行日志:


      执行日志显示只有一个表的处理,不对呀,应该是两张表,先从from查询出一张表然后再从这张表筛选出一张新表,总共两张表才对。 因有惑,所追查, 在mysql5.6中,如果是这样写确实会出现两张表的处理,本人一顿操作将版本切换到5.6再执行如下:

      这时结果就完全正确了,执行日志显示出现了一个主表一个Derived表,根据资料显示,Derived为派生表,也就是说,from里面查询出的是派生表,也可以理解为临时表,先从score表格中查询的记录放到这个临时表,然后再从这个临时表进行分组,分组后的结果放入一张新表,就产生了正确结果。

      那么为什么切换了版本后就好了呢? 其实mysql5.7针对于5.6版本做了一个优化,针对mysql本身的优化器增加了一个控制优化器的参数叫 derived_merge ,什么意思呢,“派生类合并”

      什么意思呢,据mysql官方使用手册的说法:


      那这就谢逼了呀,这个跟我没写 from 嵌套子查询有什么区别。

      oh,我太难了。

      ok,既然已经了解了很多,原来是派生类合并在作怪,通过对mysql官方使用手册的了解,mysql5.7对 derived_merge 参数默认设置为on,也就是开启状态,我们在mysql5.7中把它关闭 shut downn 使用如下命令:

set session optimizer_switch=‘derived_merge=off’;
set global optimizer_switch=‘derived_merge=off’;

      这样如果from中查询出来的的结果就不会与外部查询块合并了,sql执行结果如下:



      其实修改 derived_merge 参数得谨慎而行之,因为mysql5.7版本有了这个优化的机制是有它的道理的,之所以去除派生类与外部块合并,是因为减少查询开销,派生类是个临时表,开辟一个临时表的同时还要维护和排序或者分组,都会影响效率,所以尽量不要去修改此参数。

      其实也有多种办法不需要修改 derived_merge 参数而使合并派生类失效,具体做法可参考官方使用手册, 摘抄手册文:

可以通过在子查询中使用任何阻止合并的构造来禁用合并,尽管这些构造对实现的影响并不明确。 防止合并的构造对于派生表和视图引用是相同的:
   1.聚合函数( SUM() , MIN() , MAX() , COUNT()等)
   2.DISTINCT
   3.GROUP BY
   4.HAVING
   5.LIMIT
   6.UNION或UNION ALL
   7.选择列表中的子查询
   8.分配给用户变量
   9.仅引用文字值(在这种情况下,没有基础表)



      另外说说上面的问题,在 derived_merge 是开启的时候,不知道有没有注意到既然from里面的子查询和不写子查询没有区别,因为mysql会把子查询跟外部查询块一起合并,上面的sql如下:

SELECT
   t.stu_name,
   t.course_name,
   max( t.score )
FROM
   ( SELECT stu_name, course_name, score FROM score ORDER BY score DESC ) t
GROUP BY
   t.course_name

      既然由于这个机制,里面的 order by 应该会跟外部块一起执行,也就是说 order by 会跑到外面来(说的形象一点哈),那么为什么结果的排序依旧是乱的:


      这里得查一下使用文档,上面是这样说的:

      上面的sql里的外部块由于使用到了分组,那么优化器会忽略掉 order by 子句

      这次就到这里,持续关注哦~~


<think>好的,我现在需要回答用户关于MySQL中的/*+ NO_MERGE */提示的问题。首先,我要确认用户的问题是什么。用户想了解这个特定的优化器提示的作用和用法。 首先,我应该回忆一下MySQL中的优化器提示(Optimizer Hints)的基本知识。优化器提示是用来指导查询优化器如何执行查询的指令,通常以注释的形式嵌入到SQL语句中。这些提示可以影响执行计划,比如选择索引、连接顺序等。 接下来,我需要确定/*+ NO_MERGE */的具体作用。根据之前的了解,NO_MERGE通常用于阻止优化器将视图或派生表合并到外部查询中。也就是说,当查询中包含子查询、派生表或者视图时,优化器可能会选择将其与外部查询合并,以便优化执行计划。但有时候这种合并可能导致性能问题,这时候使用NO_MERGE可以保持派生表或视图的独立性,让优化器单独处理它们。 然后,我需要考虑用户可能的实际应用场景。例如,当子查询很复杂,或者合并后导致执行计划不佳时,使用NO_MERGE可以强制优化器单独处理该部分,可能会提高性能。或者,在某些情况下,用户可能希望明确控制执行流程,避免优化器的自动优化带来的不可预测结果。 还需要验证语法是否正确。在MySQL中,优化器提示的格式通常是/*+ ... */,放在SELECT、UPDATE等关键字之后。例如:SELECT /*+ NO_MERGE(derived_table) */ ... FROM (SELECT ...) AS derived_table ...; 另外,要注意不同MySQL版本的支持情况。可能某些提示只在特定版本中有效,或者行为有所不同。需要确认当前文档或官方资料中关于NO_MERGE的说明,确保信息的准确性。 同时,应该举例说明如何使用这个提示。比如,一个包含派生表的查询,添加NO_MERGE后,执行计划的变化。可以比较有无该提示时的EXPLAIN输出,说明差异。 还要提醒用户使用时需要注意的地方,比如是否会影响性能,是否适用于特定场景,以及可能的副作用。例如,阻止合并可能导致临时表的生成,增加内存或磁盘的使用,需要权衡利弊。 最后,总结NO_MERGE的作用、适用场景、使用方法和注意事项,帮助用户全面理解该提示的用途。</think>以下是关于MySQL中`/*+ NO_MERGE */`优化器提示的详细解析,帮助你理解其作用和使用场景: --- ### **1. 核心作用** `/*+ NO_MERGE */` 是一种 **优化器提示(Optimizer Hint)**,用于阻止MySQL将 **派生表(Derived Table)** 或 **视图(View)** 合并(Merge)到外层查询中。 通过强制优化器单独处理子查询或视图,可以避免某些情况下因自动合并导致的性能问题或执行计划偏差。 --- ### **2. 使用场景** #### **(1) 保留派生表的独立性** 默认情况下,MySQL会尝试将派生表(如子查询生成的临时表)与外层查询合并以优化执行计划。但以下场景需手动阻止合并: - 派生表包含复杂计算或聚合函数,合并后可能导致性能下降。 - 需要明确控制执行顺序或强制使用临时表。 #### **(2) 调试对比执行计划** 通过对比使用`NO_MERGE`前后的执行计划(`EXPLAIN`),分析合并操作对性能的影响。 --- ### **3. 语法格式** 将提示直接嵌入SQL语句的注释中,格式为`/*+ NO_MERGE(表别名) */`: ```sql SELECT /*+ NO_MERGE(derived_table) */ derived_table.id, users.name FROM ( SELECT user_id AS id, COUNT(*) AS order_count FROM orders GROUP BY user_id ) AS derived_table -- 必须为派生表指定别名 JOIN users ON derived_table.id = users.id; ``` --- ### **4. 执行计划对比** 通过`EXPLAIN`观察优化器行为变化: #### **(1) 未使用`NO_MERGE`时** ```sql EXPLAIN SELECT derived_table.id, users.name FROM ( SELECT user_id AS id, COUNT(*) AS order_count FROM orders GROUP BY user_id ) AS derived_table JOIN users ON derived_table.id = users.id; ``` - 结果可能显示派生表被合并到外层查询(`select_type: PRIMARY`,无临时表)。 #### **(2) 使用`NO_MERGE`后** ```sql EXPLAIN SELECT /*+ NO_MERGE(derived_table) */ derived_table.id, users.name FROM (...) AS derived_table JOIN users ...; ``` - 结果中派生表会以独立步骤处理(`select_type: DERIVED`,生成临时表)。 --- ### **5. 实际应用示例** **场景**:统计用户订单数量,并筛选出订单数大于10的用户及其姓名。 **问题**:当派生表被合并时,可能无法有效利用索引或导致全表扫描。 **解决方案**:强制独立处理派生表: ```sql SELECT /*+ NO_MERGE(order_stats) */ order_stats.user_id, users.name, order_stats.total_orders FROM ( SELECT user_id, COUNT(*) AS total_orders FROM orders GROUP BY user_id ) AS order_stats -- 派生表别名 JOIN users ON order_stats.user_id = users.id WHERE order_stats.total_orders > 10; ``` --- ### **6. 注意事项** 1. **别名必填**:必须为派生表或视图指定别名,并在提示中引用该别名。 2. **性能权衡**: - ✅ 优点:可能避免低效的合并操作,减少全表扫描。 - ❌ 缺点:强制生成临时表可能增加内存或磁盘开销。 3. **版本兼容性**:优化器提示需MySQL 5.7+支持,部分版本可能需要调整语法(如Percona分支)。 --- ### **总结对比表** | **行为** | 默认合并派生表 | 使用`/*+ NO_MERGE */` | |-------------------------|-------------------------|-----------------------------| | **派生表处理方式** | 合并到外层查询 | 独立生成临时表 | | **执行计划中的`select_type`** | 可能显示`PRIMARY` | 显示`DERIVED` | | **适用场景** | 简单子查询优化 | 复杂聚合、强制独立处理 | 合理使用`NO_MERGE`可以帮助优化复杂查询,但需结合`EXPLAIN`分析验证效果!
评论 11
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值