之前经常看到一些关于oracle优化的方法,但是数据量比较小时都不太关注这些,但是真正遇到这些问题,大数据量时如果sql写的不合适,效率将非常低,浪费我们大量的时间。
-
统计总数
差不多从学sql开始就知道count(*)
可以用来统计总数,但是同一记录统计总数的sql不同差别也很大,我们在700多万的一个表里执行count(*)
耗时70多秒,count(1)
耗时50多秒,count(索隐列)
耗时7秒,可以看出差别还是很大的。 -
统计不在某范围的数据
-
not in
-
not exists
-
minus
三者的效率差别也特别大,我们经常会遇到求不在某一范围的数据。这三种方式都能实现,数据量在10000左右时not in 的效率已经非常慢了。
minus是对结果集直接求差集
(结果A)minus(结果B)效率很高,not exists(select * from A where not exists in (select * from B where A.主键=B.主键))
not in
( select * from A where A.主键 not in(select B.主键 from B where A.主键=B.主键))
三者的效率 minus>not exists>not in