数据库select in语句怎么优化

最新推荐文章于 2024-07-17 04:38:33 发布

转载最新推荐文章于 2024-07-17 04:38:33 发布 · 2.3k 阅读

44 篇文章

订阅专栏

SELECT COUNT(*) FROM receivefax t WHERE t.fax_number IN (SELECT td.telephone FROM tmp_duanxin_ljx_20100402 td)
怎么能优化下，表t数据量近4000万 表td数据量32万多
过程是在表td里的数据通过telephone=fax_number 关联查出在表t里有多少量
高手出来帮忙下，非常感谢啊，等的郁闷死了

补充下，表td里的一条数据可能在表t里有能对应多条记录，我只需要一对一就可以，是不是直接distinct就可以了

1. t.fax_number 和  td.telephone 都应该有索引，不然怎么弄都慢的
2. 换用存在语法代替in语法，楼上有说的
3. 不觉得连接语法会比存在语法快很多，lz可以试一下。
4. 试试以下变通会不会快一点

SELECT SUM(CNT) FROM (select (select count(*) as cnt from receivefax t where  t.fax_number  = td.telephone) AS CNT  from tmp_duanxin_ljx_20100402 td ); 

我试了一下这样比存在语法要快一倍，连接语法和存在语法的速度差别不大 

你是说TD表中可能有重复的吗？如果这样的话，我这个查询应该是没有压缩重复的，连接查询也没有压缩，存在和in查询都是忽略了TD中的重复的。至于t中的重复，都是*肯定没有压缩的 

查询优化是很复杂的，和具体的表的设计情况、表中数据的重复情况等等也有很大关系的，你自己用多种方法试一试吧，如果是oracle 在PL/SQL中执行完了，按F5进去可以看具体的执行情况，其它的一般也带查询分析器之类的，只有这样才能真正看出你的SQL语句的执行效率的

SELECT COUNT(*) FROM receivefax t WHERE 
EXISTS (SELECT td.telephone FROM tmp_duanxin_ljx_20100402 td where td.telephone=t.fax_number)
试试这个 

我觉得你应该使用表连接更有效率:
SELECT COUNT(*) FROM receivefax t, tmp_duanxin_ljx_20100402 td where td.telephone=t.fax_number

select count(*) from receivefax t
inner join tmp_duanxin_ljx_20100402 td 
on t.fax_number=td.telephone

In的效率低，而且如果是Oracle的话，对于in子句结果集的数量也有限制

因为没有你那么大的数据量环境，所以无法测试比较执行时间。

更多taol讨论：http://bbs.youkuaiyun.com/topics/310105564