今天做了一个很简单的子查询,表a有4w多条的数据,而b 有6k多条,代码如下:
SELECT * FROM a WHERE id IN (SELECT id FROM b)
但是效率却很慢,查询了书和网上的信息得到了如下的结论:
可以使用关联查询代替子查询。
比较了一下:
1:使用子查询的explain结果(两个表都有id的索引)
SELECT * FROM a WHERE id IN (SELECT id FROM b)
为什么会出现这种情况呢?
大家会认为mysql是先执行里面的sql,得到id(1,2,3,4),然后在执行外层的sql,select * from a where id in (1,2,3,4)
实际上,mysql是如下查询的
select * from a where exists (select * from b where b=6 and b.id = a.id)
mysql 先执行外面的表获取id,再到里面进行对比。
所以如果外面的表数据量越大,速度越慢。
因此可以使用join来代替。
2:使用关联查询
SELECT a.* FROM a join b on a.id=b.id
对比以上结果可以看出关联查询快的很多。
总结:
1:子查询的优化尽可能使用关联查询代替。
2:不能保证任何情况关联查询逗比子查询快,具体情况要看一下,那个更快一些。
3:其实不建议直接用mysql做关联查询,可以a表查出来后,通过程序拼接,再到b表里面去查。
本文探讨了在MySQL中,子查询效率低下的问题。当一个4w条记录的表a通过id与6k条记录的表b进行查询时,使用子查询效率较低。原因是MySQL实际执行时先获取外部表的id,再与内部表对比。通过实验对比,发现使用JOIN查询比子查询更快。总结建议在优化时考虑使用JOIN,并指出在某些情况下,先将大表数据取出,通过程序处理后再查询小表可能更为高效。
1000

被折叠的 条评论
为什么被折叠?



