全表查询(待验证)

最新推荐文章于 2024-04-19 18:38:51 发布

mianli52

最新推荐文章于 2024-04-19 18:38:51 发布

阅读量165

点赞数

文章标签： oracle 数据库 null 数据结构 buffer table

本文链接：https://blog.youkuaiyun.com/mianli52/article/details/3985750

版权

全表扫描就是把整张表的数据块全部读取出来.

1.全表扫描的成本
全表扫描的成本 = 表的数据块总数 / 多块读取

cost of table full scan = user_tables.blocks / db_file_multiblock_read_count

从这里可以看出来, oracle在进行全表扫描时进行的是多块读取, 也就是说每次从buffer cache中读取多块,而不是一次一块的读.
另外, 全表扫描的成本中并不包括对数据进行过滤和计算的成本.
也就是说全表扫描的成本仅仅是读取数据的成本, 而不包含对数据进行计算,过滤的cpu成本.

2.全表扫描的稳定性
相对于索引范围扫描来说, 全表扫描的成本是衡定不变的.
无论你的查询是想访问一笔数据还是访问整个表的所有数据, 全表扫描都会把整张表读出来.
而索引范围扫描就不同, 因为有了索引这个有序的数据结构做支持, 可以只访问需要的索引块和需要的数据块, 而不是访问整张表.

无论你的查询是想访问一笔数据还是访问整个表的所有数据, 全表扫描都会把整张表读出来. ]

ps :在stopkey机制下应该是不一定要读取整个表

这个我忽略的, 刚才实验了一下, 使用rownum限制返回结果的时候是不需要读取整个表的, 另外用sample来抽样访问表的时候也不需要读取整张表.

全表扫描只是指一种查找数据，读取数据的方法，究竟会读取多少数据到内存中，肯定是根据需要来读的。
否则，岂不是，ORACLE直接要把所有数据先都放到内存中，然后在内存中作各种计算，排序工作，这个其实是内存数据库的概念了，ORACLE是磁盘数据库，不是内存数据库，即使内存数据库也不是最大的表有多大，就必须内存有多大的。

我的理解即使全表扫描, 也不是先把所有数据都取出来, 然后再进行各种过滤和计算.
我想也应该是取一部分数据, 过滤或者计算一部分, 然后再取一部分, 再计算一部分.
但是由于没有索引, oracle并不知道什么时候该停下来(除非指定rownum或者sample), 所以一定要把整张表的数据都读取一遍才能得到正确的返回结果.

就像你要从书中找任何一个知识点你都要把整本书翻一遍
而不是通过目录来找

****************************************************************

本文对 SQL 在什么情况下进行全表扫描的问题给出了全面解析，大家在实际运用中可以作个参考。

　　1：对返回的行无任何限定条件，即没有where 字句。

　　2：对数据表与任何索引主列相对应的行限定条件，例如：在City-State-Zip列创建了三列复合索引，那么仅对State有列限定条件不能使用这个索引，因为State不是索引的主列。

　　3：对索引的主列有限定条件，但是条件在表达式里使用，例如：在City上有索引，但是若使用表达式，如：

以下是引用片段：
where upper(city)='TokYo' 或
　　City || 'X' like 'TOKYO%',

　　那么不会使用索引。

　　4：对索引的主列有限定条件，但是条件或者是Null或者是不相等。例如：在City上有索引，但是若使用表达式，如:

以下是引用片段：
where City is null,where City is
　　not null,Where city!='TOKYO'.

　　5: 对索引的主列有限定条件，但是条件使用like操作以及值以‘%’开始或者值是一个赋值变量。例如：

以下是引用片段：
where City like '%YOK%'
　　where City like: City_bind_Variable xl_rao

*************************************

select sum(unit)
from t_ppp a
where a.customer_1 = 211212
and ( exists (select 1
from t_pp
where snd_id = 4
and customer_1 = 211212
and status not in (3, 4, 5, 7)))
or exists (select 1
from t_cp
where snd_id = 4
and customer_1 = 211212
and (state = 1 or pause_date > = add_months(sysdate, -3)))
and a.fst_id = 1111
and a.snd_id = 4;

t_ppp中PK为fst_id和snd_id，t_ppp有两个索引，列customer_1的normal索引和PK的索引

问题：
查询语句如上时对t_ppp表进行的是按索引查询，可是当把a.customer_1 = 211212条件写在两个exists后面的任何地方，或者去掉这条条件，那对t_ppp表的查询都是全表查询？实在没搞明白，望各位高手指点迷津