in 和 exists 使用区别

本文探讨了SQL查询中使用in与exists的不同场景及其效率差异。指出当T1表远小于T2表时,使用exists更为高效;反之,若T1表远大于T2表,则使用in更优。此外,还详细解释了exists与in的具体用法及注意事项。

有两个简单例子,以说明 “exists”和“in”的效率问题

1) select * from T1 where exists(select 1 from T2 where T1.a=T2.a) ;

    T1数据量小而T2数据量非常大时,T1<<T2 时,1) 的查询效率高。

2) select * from T1 where T1.a in (select T2.a from T2) ;

     T1数据量非常大而T2数据量小时,T1>>T2 时,2) 的查询效率高。

exists 用法:

请注意 1)句中的有颜色字体的部分 ,理解其含义;

其中 “select 1 from T2 where T1.a=T2.a” 相当于一个关联表查询,相当于

“select 1 from T1,T2     where T1.a=T2.a”

但是,如果你当当执行 1) 句括号里的语句,是会报语法错误的,这也是使用exists需要注意的地方。

“exists(xxx)”就表示括号里的语句能不能查出记录,它要查的记录是否存在。

因此“select 1”这里的 “1”其实是无关紧要的,换成“*”也没问题,它只在乎括号里的数据能不能查找出来,是否存在这样的记录,如果存在,这 1) 句的where 条件成立。

 

in 的用法:

继续引用上面的例子

“2) select * from T1 where T1.a in (select T2.a from T2) ”

这里的“in”后面括号里的语句搜索出来的字段的内容一定要相对应,一般来说,T1和T2这两个表的a字段表达的意义应该是一样的,否则这样查没什么意义。

打个比方:T1,T2表都有一个字段,表示工单号,但是T1表示工单号的字段名叫“ticketid”,T2则为“id”,但是其表达的意义是一样的,而且数据格式也是一样的。这时,用 2)的写法就可以这样:

“select * from T1 where T1.ticketid in (select T2.id from T2) ”

Select name from employee where name not in (select name from student);

Select name from employee where not exists (select name from student);

第一句SQL语句的执行效率不如第二句。

通过使用EXISTS,Oracle会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。Oracle在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因.

================

exists (sql 返回结果集为真) 
not exists (sql 不返回结果集为真) 

在MySQL中,`IN``EXISTS`都是用于子查询的条件判断操作符,但它们在执行逻辑性能上有显著区别: ### 1. **执行逻辑** - **IN**: 先执行子查询,将结果集缓存到内存中,然后遍历外部查询的每一行,检查是否在子查询结果集中。 ```sql SELECT * FROM table_a WHERE column_x IN (SELECT column_y FROM table_b); ``` - **EXISTS**: 对外部查询的每一行,执行子查询检查是否存在匹配(返回布尔值)。子查询通常关联外部表(通过`WHERE`条件)。 ```sql SELECT * FROM table_a a WHERE EXISTS (SELECT 1 FROM table_b b WHERE a.column_x = b.column_y); ``` ### 2. **性能差异** - **IN**: - 适合子查询结果集较小的情况(因为结果集需全部加载到内存)。 - 若子查询结果集大,可能导致性能下降(内存占用高)。 - 对结果集去重(`IN`隐式处理重复值)。 - **EXISTS**: - 适合子查询关联外部表且结果集较大的情况(逐行判断,无需缓存全部结果)。 - 遇到第一个匹配项即停止搜索(短路逻辑),可能更高效。 - 不关心子查询返回的具体值,仅判断是否存在。 ### 3. **NULL值处理** - **IN**: 若子查询返回`NULL`,外部查询中`IN`条件会返回`NULL`(非真非假),导致该行被过滤。 ```sql -- 若子查询返回NULL,结果可能不符合预期 SELECT * FROM table_a WHERE column_x IN (NULL, 1, 2); ``` - **EXISTS**: 忽略`NULL`值,仅判断是否存在匹配行。 ### 4. **使用建议** - **优先用`EXISTS`**: 当子查询关联外部表或结果集较大时(如`table_b`有索引且通过关联条件过滤)。 - **优先用`IN`**: 当子查询结果集较小且固定(如静态列表或小表),或需要明确比较值列表时。 ### 示例对比 ```sql -- IN示例:检查是否在固定列表中 SELECT * FROM employees WHERE department_id IN (10, 20, 30); -- EXISTS示例:检查是否存在关联订单 SELECT * FROM customers c WHERE EXISTS (SELECT 1 FROM orders o WHERE o.customer_id = c.id); ``` ### 优化提示 - 对`EXISTS`的子查询关联字段建立索引。 - 避免在`IN`的子查询中使用无索引的列(可能导致全表扫描)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值