exist in

最新推荐文章于 2024-03-13 15:53:27 发布

转载最新推荐文章于 2024-03-13 15:53:27 发布 · 106 阅读

In 适合于外表大而内表小的情况；Exits 适合于外表小而内表大的情况。

in list是非关联子查询，用于子集小的情况下

exist是关联子查询，用于母集小的情况下

某大型应用数据库系统中，有T1和T2两个表，并且这两个表通过字段a关联，不同的开发人员编写了两个不同的语句来实现同一个查询结果，请选出查询效率分析正确的选项：
1）select*from T1 where exists(select 1 from T2 where T1.a=T2a);
2) select*from T1 where T1.a in (select T2.a from T2);
供选择的答案：
A：T1数据量非常大而T2数据量小时，语句1）的询效率高。
B：T1数据量小而T2数据量非常大时，语句2）的查询效率高。
C：T1数据量小而T2数据量非常大时，语句1）的查询效率高
D：T1数据量非常大而T2数据是小时，语句2）的查询效率高
E：语句1）的查询效率高。
F：语句2）的查询效率高。

--cd

对于exist和in，大家的一致看法如下:
    1.in是子查询为驱动表，外面的表为被驱动表，故适用于子查询结果集小而
外面的表结果集大的情况。
    2.exists是外面的表位驱动表，子查询里面的表为被驱动表，故适用于外面
的表结果集小而子查询结果集大的情况。
    而为何会出现这种exists和in的使用上的区别呢，其实问题的关键在于关联
子查询和非关联子查询上。exists一般都是关联子查询，in则一般都是非关联
子查询。
    对于关联子查询，必须先执行外层查询，接着对所有通过过滤条件的记录，执行
内层查询。外层查询和内层查询相互依赖，因为外层查询会把数据传递给内层查询。
    非关联子查询则必须先完成内层查询之后，外层查询才能介入。
exsits:
select whatever from table_a a
where exists(
   select null from table_b b
    where b.id=a.id
    and somecondition
)
and somecondition
    可以看到，在exists子查询里面，有关键的一个连接条件:where b.id=a.id，就是这个条件决定了必须先找出a中符合条件的记录，然后才能与b连接，最终得出查询的结果。这就是为什么说exists适用于外面的表结果集小而子查询结果集大的情况。因为必须先执行外层查询，然后才能执行内层查询。
    而in则恰恰相反，不再详述。