In 适合于外表大而内表小的情况;Exits 适合于外表小而内表大的情况。
in list是非关联子查询,用于子集小的情况下
exist是关联子查询,用于母集小的情况下
某大型应用数据库系统中,有T1和T2两个表,并且这两个表通过字段a关联,不同的开发人员编写了两个不同的语句来实现同一个查询结果,请选出查询效率分析正确的选项:
1)select*from T1 where exists(select 1 from T2 where T1.a=T2a);
2) select*from T1 where T1.a in (select T2.a from T2);
供选择的答案:
A:T1数据量非常大而T2数据量小时,语句1)的 询效率高。
B:T1数据量小而T2数据量非常大时,语句2)的查询效率高。
C:T1数据量小而T2数据量非常大时,语句1)的查询效率高
D:T1数据量非常大而T2数据是小时,语句2)的查询效率高
E:语句1)的查询效率高。
F:语句2)的查询效率高。
--cd
对于exist和in,大家的一致看法如下:
1.in是子查询为驱动表,外面的表为被驱动表,故适用于子查询结果集小而
外面的表结果集大的情况。
2.exists是外面的表位驱动表,子查询里面的表为被驱动表,故适用于外面
的表结果集小而子查询结果集大的情况。
而为何会出现这种exists和in的使用上的区别呢,其实问题的关键在于关联
子查询和非关联子查询上。exists一般都是关联子查询,in则一般都是非关联
子查询。
对于关联子查询,必须先执行外层查询,接着对所有通过过滤条件的记录,执行
内层查询。外层查询和内层查询相互依赖,因为外层查询会把数据传递给内层查询。
非关联子查询则必须先完成内层查询之后,外层查询才能介入。
exsits:
select whatever from table_a a
where exists(
select null from table_b b
where b.id=a.id
and somecondition
)
and somecondition
可以看到,在exists子查询里面,有关键的一个连接条件:where b.id=a.id,就是这个条件决定了必须先找出a中符合条件的记录,然后才能与b连接,最终得出查询的结果。这就是为什么说exists适用于外面的表结果集小而子查询结果集大的情况。因为必须先执行外层查询,然后才能执行内层查询。
而in则恰恰相反,不再详述。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23895263/viewspace-666579/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/23895263/viewspace-666579/