之前经常看到一些关于oracle优化的方法,但是数据量比较小时都不太关注这些,但是真正遇到这些问题,大数据量时如果sql写的不合适,效率将非常低,浪费我们大量的时间。
-
统计总数
差不多从学sql开始就知道count(*)可以用来统计总数,但是同一记录统计总数的sql不同差别也很大,我们在700多万的一个表里执行count(*)耗时70多秒,count(1)耗时50多秒,count(索隐列)耗时7秒,可以看出差别还是很大的。 -
统计不在某范围的数据
-
not in
-
not exists
-
minus
三者的效率差别也特别大,我们经常会遇到求不在某一范围的数据。这三种方式都能实现,数据量在10000左右时not in 的效率已经非常慢了。
minus是对结果集直接求差集
(结果A)minus(结果B)效率很高,not exists(select * from A where not exists in (select * from B where A.主键=B.主键))
not in
( select * from A where A.主键 not in(select B.主键 from B where A.主键=B.主键))
三者的效率 minus>not exists>not in
本文探讨了在大数据量下SQL优化的重要性,对比了count(*)、count(1)和count(索引列)的性能差异,以及使用not in、not exists和minus进行数据筛选时的效率区别。
1768

被折叠的 条评论
为什么被折叠?



