全表扫描就是把整张表的数据块全部读取出来.
1.全表扫描的成本
全表扫描的成本 = 表的数据块总数 / 多块读取
cost of table full scan = user_tables.blocks / db_file_multiblock_read_count
从这里可以看出来, oracle在进行全表扫描时进行的是多块读取, 也就是说每次从buffer cache中读取多块,而不是一次一块的读.
另外, 全表扫描的成本中并不包括对数据进行过滤和计算的成本.
也就是说全表扫描的成本仅仅是读取数据的成本, 而不包含对数据进行计算,过滤的cpu成本.
2.全表扫描的稳定性
相对于索引范围扫描来说, 全表扫描的成本是衡定不变的.
无论你的查询是想访问一笔数据还是访问整个表的所有数据, 全表扫描都会把整张表读出来.
而索引范围扫描就不同, 因为有了索引这个有序的数据结构做支持, 可以只访问需要的索引块和需要的数据块, 而不是访问整张表.
无论你的查询是想访问一笔数据还是访问整个表的所有数据, 全表扫描都会把整张表读出来. ]
ps :在stopkey机制下应该是不一定要读取整个表
这个我忽略的, 刚才实验了一下, 使用rownum限制返回结果的时候是不需要读取整个表的, 另外用sample来抽样访问表的时候也不需要读取整张表.
否则,岂不是,ORACLE直接要把所有数据先都放到内存中,然后在内存中作各种计算,排序工作,这个其实是内存数据库的概念了,ORACLE是磁盘数据库,不是内存数据库,即使内存数据库也不是最大的表有多大,就必须内存有多大的。
我的理解即使全表扫描, 也不是先把所有数据都取出来, 然后再进行各种过滤和计算.
我想也应该是取一部分数据, 过滤或者计算一部分, 然后再取一部分, 再计算一部分.
但是由于没有索引, oracle并不知道什么时候该停下来(除非指定rownum或者sample), 所以一定要把整张表的数据都读取一遍才能得到正确的返回结果.
就像你要从书中找任何一个知识点你都要把整本书翻一遍
而不是通过目录来找
****************************************************************
本文对 SQL 在什么情况下进行全表扫描的问题给出了全面解析,大家在实际运用中可以作个参考。
1:对返回的行无任何限定条件,即没有where 字句。
2:对数据表与任何索引主列相对应的行限定条件,例如:在City-State-Zip列创建了三列复合索引,那么仅对State有列限定条件不能使用这个索引,因为State不是索引的主列。
3:对索引的主列有限定条件,但是条件在表达式里使用,例如:在City上有索引,但是若使用表达式,如:
以下是引用片段:
where upper(city)='TokYo' 或
City || 'X' like 'TOKYO%',
那么不会使用索引。
4:对索引的主列有限定条件,但是条件或者是Null或者是不相等。例如:在City上有索引,但是若使用表达式,如:
以下是引用片段:
where City is null,where City is
not null,Where city!='TOKYO'.
5: 对索引的主列有限定条件,但是条件使用like操作以及值以‘%’开始或者值是一个赋值变量。例如:
以下是引用片段:
where City like '%YOK%'
where City like: City_bind_Variable xl_rao
-
*************************************
select sum(unit)
from t_ppp a
where a.customer_1 = 211212
and ( exists (select 1
from t_pp
where snd_id = 4
and customer_1 = 211212
and status not in (3, 4, 5, 7)))
or exists (select 1
from t_cp
where snd_id = 4
and customer_1 = 211212
and (state = 1 or pause_date > = add_months(sysdate, -3)))
and a.fst_id = 1111
and a.snd_id = 4;
t_ppp中PK为fst_id和snd_id,t_ppp有两个索引,列customer_1的normal索引和PK的索引
问题:
查询语句如上时对t_ppp表进行的是按索引查询,可是当把a.customer_1 = 211212条件写在两个exists后面的任何地方,或者去掉这条条件,那对t_ppp表的查询都是全表查询?实在没搞明白,望各位高手指点迷津
使用了not in和or,这两个是全表查询的
where是从下往上执行的
就是一条一条往where靠近
IN 就遍历整个表,查到也会继续遍历
而exists只要查到就退出.效率会更高一些.