Oracle 表分析说明

最新推荐文章于 2024-06-27 17:57:31 发布

原创最新推荐文章于 2024-06-27 17:57:31 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#oracle #table #statistics #structure #工具 #delete

Oracle 专栏收录该内容

65 篇文章

订阅专栏

Oracle 表分析说明

一、表分析概念

1. 简单的说，就是收集表和索引的信息，CBO根据这些信息决定SQL最佳的执行路径。通过对表的分析，可以产生一些统计信息，通过这些信息oracle的优化程序可以优化。

1) 收集统计信息的目的是为了使基于 CBO的执行计划更加准确。

2) 分析的结果数据[all_tables]有什么用，要看Oracle初始化参数 optimal_mode 怎么设置的。

3) 分析更新表的统计信息,有可能导致执行计划改变

2. 用analyze或dbms_stats包做统计表的的分析,分析可以判断表的使用情况,比如行迁移情况、表的资料量情况等,如:

1) select * from all_tables where table_name='TEMP_TABLE';（表名一定要大写）

如果对该表没有做过统计分析，则查询的大部分栏位值都为空

2) analyze table tableName compute statistics;

执行时间与表的数据量有关

3) select * from all_tables where table_name=' TEMP_TABLE ';

之前为空的部分字段，现在查询已经有值

3. oracle的联机文档描述了analyze的做用：

Use the ANALYZE statement to collect non-optimizer statistics, for example, to:

--使用analyze功能可以收集一些没有进行优化的统计信息，例如：

Collect or delete statistics about an index or index partition, table or table partition,

--聚集或删除索引或索引分区，表或表分区

index-organized table, cluster, or scalar object attribute.

--索引表，串，或游标的目标属性等统计信息

Validate the structure of an index or index partition, table or table partition, index-organized table,

--增加下列结构的有效性：索引或索引分区，表或表分区，索引表

cluster, or object reference (REF).

--串，目标参照

Identify migrated and chained rows of a table or cluster.

--鉴别一个表或串中已经被移动的抑或被锁住的列。

以的analyze table abc compute statistics;这条为例，生成的统计信息会存在于user_tables这个视图，查看一下select * from user_tables where table_name='ABC';
观察一下NUM_ROWS,BLOCKS,AVG_SPACE,AVG_ROW_LEN几列你就会明白，这就是变化。分析完表之后，会发现DBA_tables 视图中，以前很多列值是空的，现在开始有数据了。这些数据就是分析表得到的.

命令行方式可以采用analyze命令
如Analyze table tablename compute statistics;
Analyze index|cluster indexname estimate statistics;
ANALYZE TABLE tablename COMPUTE STATISTICS
FOR TABLE
FOR ALL [LOCAL] INDEXES
FOR ALL [INDEXED] COLUMNS;
ANALYZE TABLE tablename DELETE STATISTICS
ANALYZE TABLE tablename VALIDATE REF UPDATE
ANALYZE TABLE tablename VALIDATE STRUCTURE
[CASCADE]|[INTO TableName]
ANALYZE TABLE tablename LIST CHAINED ROWS [INTO TableName]
等等

4. dbms_stats包的作用主要是替代analyze的收集统计信息这一块的功能，且在这一方面做了相当大程度上的增强。

5. 带有ESTIMATE选项的ANALYZE操作对于一些表能够产生不正确的结果，尤其是那些取样较小的表。这不是个BUG,而是每个统计取样方法的特性。如果所选取样不能代表整个数据集，你就不能期待产生正确的统计。

6. 统计分析，在Oracle 10G中能够保存列值的分布信息

7. 在考虑表分析时，需要考虑如下问题:

1) 对一个带索引的表的ANALYZE，将分析其相关索引。

2) 如果你对一个表进行ANALYZE ... ESTIMATE分析，那么然后在其相关索引上做ANALYZE COMPUTE分析是很明智的。这样可以确保被索引字段的统计是准确的。

3) 分析索引不用到临时表空间

4) 如果分析一个索引而不分析其基表，在这一单一基础上CBO不会被选中如果你需要使用ESTIMATE-估计（例如，由于时间的限制），建议你在几个不同的取样大小上进行 ANALYZE ... ESTIMATE，来确定每个对象的理想的取样大小。总的目标是找到一个能在最短的时间内产生准确的统计的取样大小。较好的开始点是 10% - 15%

5) 进行超过50%的ANALYZE ... ESTIMATE就会导致/变成ANALYZE ... COMPUTE。

如果想分析整个用户或数据库，还可以采用工具包，可以并行分析
Dbms_utility(8i以前的工具包)
Dbms_stats(8i以后提供的工具包)
如
dbms_stats.gather_schema_stats(User,estimate_percent=>100,cascade=> TRUE);
dbms_stats.gather_table_stats(User,TableName,degree => 4,cascade => true);

这是对命令与工具包的一些总结
(1)、对于分区表，建议使用DBMS_STATS，而不是使用Analyze语句。
         a) 可以并行进行，对多个用户，多个Table
         b) 可以得到整个分区表的数据和单个分区的数据。
         c) 可以在不同级别上Compute Statistics：单个分区，子分区，全表，所有分区
         d) 可以倒出统计信息
         e) 可以用户自动收集统计信息
(2)、DBMS_STATS的缺点
        a) 不能Validate Structure
        b) 不能收集CHAINED ROWS, 不能收集CLUSTER TABLE的信息，这两个仍旧需要使用Analyze语句。
        c) DBMS_STATS 默认不对索引进行Analyze，因为默认Cascade是False，需要手工指定为True
(3)、对于oracle 9里面的External Table，Analyze不能使用，只能使用DBMS_STATS来收集信息.