今天查询一个表中的重复数据(表中数据1万6左右),用了两种方法,查询结果实在让人惊讶
SELECT * from tab1 where CompanyName in( SELECT companyname from tab1 GROUP BY CompanyName HAVING COUNT(*)>1);-- 129.433ms
SELECT * from tab1 INNER join ( SELECT companyname from tab1 GROUP BY CompanyName HAVING COUNT(*)>1) as tab2 USING(CompanyName);-- 0.482ms所以建议大家查询数据时,如果想性能高一点的话,尽量少用in, like '%' 等,能用表连接时,尽量不要用in,效率会很低,如果表中数据量很大,可以建立索引,或多重索引进行查
询,效率会有明显提高。
本文探讨了在SQL查询中使用IN操作的性能问题,并提供了替代方案,通过表连接来提高查询效率,特别是在大数据量场景下,建议建立索引以显著提升查询速度。
8438

被折叠的 条评论
为什么被折叠?



