CLUSTERING FACTOR

本文通过创建两个具有不同数据分布的表,并建立索引,解释了Oracle中Clustering Factor的概念及其对查询性能的影响。Clustering Factor较低表示数据在表中更有序,有助于提高索引扫描效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

The clustering_factor is a single number that represents the degree to which data is

randomly distributed through a table, and the concept of creating a number to represent the

data scatter in a table is a good one. Unfortunately, some recent, and not-so-recent, features of

Oracle can turn this magic number into a liability.

SQL> create table t as select * from dba_objects order by dbms_random.value; SQL> create table t2 as select * from dba_objects order by object_id; Table created. SQL> create index ind_t2 on t2(object_id); Index created. SQL> create index ind_t on t(object_id); Index created. SQL> exec dbms_stats.gather_table_stats(user,'t',cascade=>true); PL/SQL procedure successfully completed. SQL> exec dbms_stats.gather_table_stats(user,'t2',cascade=>true); PL/SQL procedure successfully completed. SQL> select idx.index_name,tab.table_name,tab.num_rows,tab.blocks,idx.clustering_factor from user_indexes idx inner join user_tables tab on idx.table_name=tab.table_name order by tab.table_name; INDEX_NAME TABLE_NAME NUM_ROWS BLOCKS CLUSTERING_FACTOR ------------------------------ ------------------------------ ---------- ---------- ----------------- IND_T T 72482 1058 72418 IND_T2 T2 72481 1058 1032 CLUSTERING_FACTOR与表块数接近代表该列更接近于有序。

当Clustering Factor的值越高,进行索引区间扫描的成本越高,这个时候cbo很有可能会选择全表扫描(数据不好模拟额),物理组织上更加“零散”,

这个例子可以从某种程度上解析:“为什么同一份数据在不同机器上跑,性能不一样?”。

http://asktom.oracle.com/pls/asktom/f?p=100:11:0::::P11_QUESTION_ID:1032431852141

http://forums.oracle.com/forums/thread.jspa?threadID=682158

因子分析是一种统计方法,用于探索多个变量之间的关系,并找出共同的因子结构。它的目标是将一组观测变量解释为较少数量的未观测潜在因子。因子分析关注的是变量之间的关系,通过计算因子载荷矩阵来确定每个变量对每个潜在因子的贡献程度。因子载荷矩阵反映了变量与因子之间的相关程度。 与聚类分析相比,因子分析更关注变量之间的关系,而不是样本之间的相似性。聚类分析通过将相似的样本分组,将数据划分为不同的类别。因子分析则试图从一组观测变量中提取出最重要的信息,以揭示潜在的因素结构。 与主成分分析类似,因子分析也是一种降维技术,但两者之间存在一些区别。主成分分析试图通过组合原始变量来创建新的无关变量,这些变量能够解释原始数据中的大部分变异性。与之相反,因子分析试图找到潜在的因子结构,以解释观测变量之间的相关性。 在因子分析中,还存在一种叫做稀疏因子分析的方法。传统的因子分析中,因子载荷矩阵通常是密集的,而稀疏因子分析通过引入稀疏性约束,得到更易于解释的稀疏载荷矩阵。稀疏因子分析可以帮助减少因子载荷矩阵的复杂度,提高解释性和可解释性。 因子分析在许多领域都有广泛的应用,包括心理学、社会科学、市场研究等。它可以帮助研究人员理解多个变量之间的关系,揭示潜在的因素结构,并提供有关研究领域的重要信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值