Mysql数据库查询重复数据

最新推荐文章于 2025-05-29 08:02:23 发布

原创最新推荐文章于 2025-05-29 08:02:23 发布 · 9k 阅读

7 ·

CC 4.0 BY-SA版权

MySql 专栏收录该内容

1 篇文章

订阅专栏

本文探讨了在SQL查询中使用IN操作的性能问题，并提供了替代方案，通过表连接来提高查询效率，特别是在大数据量场景下，建议建立索引以显著提升查询速度。

今天查询一个表中的重复数据(表中数据1万6左右)，用了两种方法，查询结果实在让人惊讶

SELECT * from tab1 where CompanyName in( SELECT companyname from tab1 GROUP BY CompanyName HAVING COUNT(*)>1);-- 129.433ms

SELECT * from tab1 INNER join  ( SELECT companyname from tab1 GROUP BY CompanyName HAVING COUNT(*)>1) as tab2 USING(CompanyName);-- 0.482ms

所以建议大家查询数据时，如果想性能高一点的话，尽量少用in, like '%' 等，能用表连接时，尽量不要用in,效率会很低，如果表中数据量很大，可以建立索引，或多重索引进行查

询，效率会有明显提高。