【MySQL】 exist 与in 的区别

原创已于 2024-09-18 10:59:02 修改 · 593 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #数据库

于 2024-09-04 16:25:18 首次发布

试用场景

exist：适合子查询中表数据大于外查询表中数据的业务场景
in：适合外部表数据大于子查询的表数据的业务场景

描述

　　in 和 exists的区别: 如果子查询得出的结果集记录较少，主查询中的表较大且又有索引时应该用in, 反之如果外层的主查询记录较少，子查询中的表大，又有索引时使用exists。其实我们区分in和exists主要是造成了驱动顺序的改变(这是性能变化的关键)，如果是exists，那么以外层表为驱动表，先被访问，如果是IN，那么先执行子查询，所以我们会以驱动表的快速返回为目标，那么就会考虑到索引及结果集的关系了，另外IN时不对NULL进行处理。

　 in 是把外表和内表作hash 连接，而exists是对外表作loop循环，每次loop循环再对内表进行查询。一直以来认为exists比in效率高的说法是不准确的。

差异

两者在sql中执行的差别:

exist：先执行外部查询语句，然后在执行子查询，子查询中它每次都会去执行数据库的查询，执行次数等于外查询的数据数量。查询数据库比较频繁(记住这点),如果b表再id上加了索引也会走索引。

select * from a where exist(select 1 from b.a_id=a.id);

       //外部查询
       Object[] out={select *  from a};
        List<Object> result=new ArrayList();
       for（int i=0;i<out.size();i++）{
              //子查询(内查询)
               //1 去查询数据库
               // 2 判断外部数据的值执行第一步是是否能查到数据，返回 ture或者false 
              // 3 如果第二部为true
              if（exiset(out[i].id)）{//执行  select * fron b where b.a_id=a.id;  会执行 out.size();次
                   result.add(out[i]));
               } 
       }

所以：如果a表中的数据越大那么子查询查询的次数就会越多，这样对效率就很慢。

例如: