SELECT COUNT(*) FROM receivefax t WHERE t.fax_number IN (SELECT td.telephone FROM tmp_duanxin_ljx_20100402 td) 怎么能优化下,表t数据量近4000万 表td数据量32万多 过程是在表td里的数据通过telephone=fax_number 关联查出在表t里有多少量 高手出来帮忙下,非常感谢啊,等的郁闷死了
补充下,表td里的一条数据可能在表t里有能对应多条记录,我只需要一对一就可以,是不是直接distinct就可以了
1. t.fax_number 和 td.telephone 都应该有索引,不然怎么弄都慢的 2. 换用存在语法代替in语法,楼上有说的 3. 不觉得连接语法会比存在语法快很多,lz可以试一下。 4. 试试以下变通会不会快一点 SELECT SUM(CNT) FROM (select (select count(*) as cnt from receivefax t where t.fax_number = td.telephone) AS CNT from tmp_duanxin_ljx_20100402 td ); 我试了一下这样比存在语法要快一倍,连接语法和存在语法的速度差别不大 你是说TD表中可能有重复的吗?如果这样的话,我这个查询应该是没有压缩重复的,连接查询也没有压缩,存在和in查询都是忽略了TD中的重复的。至于t中的重复,都是*肯定没有压缩的 查询优化是很复杂的,和具体的表的设计情况、表中数据的重复情况等等也有很大关系的,你自己用多种方法试一试吧,如果是oracle 在PL/SQL中执行完了,按F5进去可以看具体的执行情况,其它的一般也带查询分析器之类的,只有这样才能真正看出你的SQL语句的执行效率的
SELECT COUNT(*) FROM receivefax t WHERE EXISTS (SELECT td.telephone FROM tmp_duanxin_ljx_20100402 td where td.telephone=t.fax_number) 试试这个 我觉得你应该使用表连接更有效率: SELECT COUNT(*) FROM receivefax t, tmp_duanxin_ljx_20100402 td where td.telephone=t.fax_number
select count(*) from receivefax t inner join tmp_duanxin_ljx_20100402 td on t.fax_number=td.telephone In的效率低,而且如果是Oracle的话,对于in子句结果集的数量也有限制 因为没有你那么大的数据量环境,所以无法测试比较执行时间。
更多taol讨论:http://bbs.youkuaiyun.com/topics/310105564