oracle表分区详解

最新推荐文章于 2025-06-13 09:00:00 发布

春秋战国程序猿

最新推荐文章于 2025-06-13 09:00:00 发布

阅读量1.8k

点赞数 2

分类专栏：数据库文章标签：数据库

数据库专栏收录该内容

25 篇文章

订阅专栏

oracle表分区详解

从以下几个方面来整理关于分区表的概念及操作:
    * 表空间及分区表的概念
    * 表分区的具体作用
    * 表分区的优缺点
    * 表分区的几种类型及操作方法
    * 对表分区的维护性操作

一，表空间及分区表的概念

表空间：即tablespace，注意与table进行区分，是一个或多个数据文件的集合，所有的数据对象都存放在指定的表空
间中，但主要存放的是表，所以称作表空间。
分区表：当表中的数据量不断增大，查询数据的速度就会变慢，应用程序的性能就会下降，这时就应该考虑对表进行分区。
表进行分区后，逻辑上表仍然是一张完整的表，只是将表中的数据在物理上存放到多个表空间(物理文件上)，这样查询数据
时，不至于每次都扫描整张表。

二，表分区的具体作用

    Oracle的表分区功能通过改善可管理性、性能和可用性，从而为各式应用程序带来了极大的好处。通常，分区可以使某
些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务，分区是构建千兆字节数据系统或超高可
用性系统的关键工具。
    分区功能能够将表、索引或索引组织表进一步细分为段，这些数据库对象的段叫做分区。每个分区有自己的名称，还可
以选择自己的存储特性。从数据库管理员的角度来看，一个分区后的对象具有多个段，这些段既可进行集体管理，也可单
独管理，这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是，从应用程序的角度来看，分区后的表与非
分区表完全相同，使用SQL DML命令访问分区后的表时，无需任何修改。

什么时候使用分区表，下面是官网的2个建议：
1) 表的大小超过2GB。
2) 表中包含历史数据，新的数据被增加都新的分区中。

三，表分区的优缺点
    Oracle表分区，使得我们可以在细粒度上对表进行操作，这个思想，有些类似于ConcurrentHashMap，用了分段的思
想，也就是Segment。
优点：
1) 改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索速度。
2) 增强可用性：如果表的某个分区出现故障，表在其他分区的数据仍然可用；
3) 维护方便：如果表的某个分区出现故障，需要修复数据，只修复该分区即可；
4) 均衡I/O：可以把不同的分区映射到磁盘以平衡I/O，改善整个系统性能。

缺点：
分区表相关，已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。

四，表分区的几种类型及操作方法

1.范围分区

范围分区将数据基于范围映射到每一个分区，这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用
的，并且分区键经常采用日期。举个例子：你可能会将销售数据按照月份进行分区。
当使用范围分区时，请考虑以下几个规则：
1) 每一个分区都必须有一个VALUES LESS THEN子句，它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大
于这个上限值的记录都会被加入到下一个高一些的分区中。
2) 所有分区，除了第一个，都会有一个隐式的下限值，这个值就是此分区的前一个分区的上限值。
3) 在最高的分区中，MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值，也可以
理解为高于任何分区中指定的VALUE LESS THEN的值，同时包括空值。

例1：假设有一个CUSTOMER表，表中有数据200000行，我们将此表通过CUSTOMER_ID进行分区，每个分区存储100000行，我们
将每个分区保存到单独的表空间中，这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码，如下：
CREATE TABLE CUSTOMER
(
    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
    FIRST_NAME VARCHAR2(30) NOT NULL,
    LAST_NAME   VARCHAR2(30) NOT NULL,
    PHONE        VARCHAR2(15) NOT NULL,
    EMAIL        VARCHAR2(80),
    STATUS       CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
    PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
    PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
)

例2：按时间划分
CREATE TABLE ORDER_ACTIVITIES
(
    ORDER_ID      NUMBER(7) NOT NULL,
    ORDER_DATE    DATE,
    TOTAL_AMOUNT NUMBER,
    CUSTOTMER_ID NUMBER(7),
    PAID           CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01-MAY-2003','DD-MON-YYYY')) TABLESPACEORD_TS01,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
)

例3：MAXVALUE
CREATE TABLE RangeTable
(
idd   INT PRIMARY KEY ,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
      PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
      PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
);

2.列表分区：
该分区的特点是某列的值只有几个，基于这样的特点我们可以采用列表分区。
例1
CREATE TABLE PROBLEM_TICKETS
(
    PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY,
    DESCRIPTION VARCHAR2(2000),
    CUSTOMER_ID NUMBER(7) NOT NULL,
    DATE_ENTERED DATE NOT NULL,
    STATUS       VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
    PARTITION PROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01,
    PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02
);

例2
CREATE TABLE ListTable
(
    id    INT PRIMARY KEY ,
    name VARCHAR (20),
    area VARCHAR (10)
)
PARTITION BY LIST (area)
(
    PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
    PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
);

3.散列分区:
这类分区是在列值上使用散列算法，以确定将行放入哪个分区中。当列的值没有合适的条件时，建议使用散列分区。
散列分区为通过指定分区编号来均匀分布数据的一种分区类型，因为通过在I/O设备上进行散列分区，使得这些分区大小一致。
例1：
CREATE TABLE HASH_TABLE
(
    COL NUMBER(8),
    INF VARCHAR2(100)
)
PARTITION BY HASH (COL)
(
    PARTITION PART01 TABLESPACE HASH_TS01,
    PARTITION PART02 TABLESPACE HASH_TS02,
    PARTITION PART03 TABLESPACE HASH_TS03
)

简写：
CREATE TABLE emp
(
    EMPNO NUMBER (4),
    ENAME VARCHAR2 (30),
    SAL   NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

    hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数，
Oracle中如果你要使用hash分区，只需指定分区的数量即可。建议分区的数量采用2的n次方，这样可以使得各个分区间数
据分布更加均匀。

4.组合范围散列分区
这种分区是基于范围分区和列表分区，表首先按某列进行范围分区，然后再按某列进行列表分区，分区之中的分区被称为
子分区。

CREATE TABLE SALES
(
    PRODUCT_ID VARCHAR2(5),
    SALES_DATE DATE,
    SALES_COST NUMBER(10),
    STATUS VARCHAR2(20)
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
(
   PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
(
      SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
      SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
),
   PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
(
      SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
      SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
)
)

5.复合范围散列分区：
这种分区是基于范围分区和散列分区，表首先按某列进行范围分区，然后再按某列进行散列分区。
CREATE TABLE DINYA_TEST
(
     TRANSACTION_ID NUMBER PRIMARY KEY,
     ITEM_ID NUMBER(8) NOT NULL,
     ITEM_DESCRIPTION VARCHAR2(300),
     TRANSACTION_DATE DATE
)
PARTITION BY RANGE(TRANSACTION_DATE)SUBPARTITION BY HASH(TRANSACTION_ID)
SUBPARTITIONS 3 STORE IN DINYA_SPACE01,DINYA_SPACE02,DINYA_SPACE03)
(
    PARTITION PART_01 VALUES LESS THAN(TO_DATE(‘2006-01-01’,’YYYY-MM-DD’)),
    PARTITION PART_02 VALUES LESS THAN(TO_DATE(‘2010-01-01’,’YYYY-MM-DD’)),
    PARTITION PART_03 VALUES LESS THAN(MAXVALUE)
);

五，有关表分区的一些维护性操作

1) 添加分区
以下代码给SALES表添加了一个P3分区
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意：以上添加的分区界限应该高于最后一个分区界限。

以下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');

2) 删除分区
以下代码删除了P3表分区：
ALTER TABLE SALES DROP PARTITION P3;
在以下代码删除了P4SUB1子分区：
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想删除此分区，必须删除表。

3) 截断分区
    截断某个分区是指删除某个分区中的数据，并不会删除分区，也不会删除其它分区中的数据。当表中即使只有一个
分区时，也可以截断该分区。通过以下代码截断分区：
ALTER TABLE SALES TRUNCATE PARTITION P2;
通过以下代码截断子分区：
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;

4) 合并分区
合并分区是将相邻的分区合并成一个分区，结果分区将采用较高分区的界限，值得注意的是，不能将分区合并到界限较
低的分区。以下代码实现了P1 P2分区的合并：
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;

5) 拆分分区
    拆分分区将一个分区拆分两个新分区，拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);

6) 接合分区(coalesca)
    结合分区是将散列分区中的数据接合到其它分区中，当散列分区中的数据比较大时，可以增加散列分区，然后进行接合，
值得注意的是，接合分区只能用于散列分区中。通过以下代码进行接合分区：
ALTER TABLE SALES COALESCA PARTITION;

7) 重命名表分区
以下代码将P21更改为P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;

8) 相关查询
跨分区查询
SELECT SUM(*) FROM
(
    SELECT COUNT(*) CN FROM T_TABLE_SS PARTITION (P200709_1)
    UNION ALL
    SELECT COUNT(*) CN FROM T_TABLE_SS PARTITION (P200709_2)
);

查询表上有多少分区
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'

查询索引信息
SELECT
    OBJECT_NAME,OBJECT_TYPE,TABLESPACE_NAME,SUM(VALUE)
FROM
    V$SEGMENT_STATISTICS
WHERE
    STATISTIC_NAME IN ('PHYSICAL READS','PHYSICAL WRITE','LOGICAL READS') AND
    OBJECT_TYPE='INDEX'
    GROUP BY OBJECT_NAME,OBJECT_TYPE,TABLESPACE_NAME
    ORDER BY 4 DESC

--显示数据库所有分区表的信息：
SELECT * FROM DBA_PART_TABLES

--显示当前用户可访问的所有分区表信息:
SELECT * FROM ALL_PART_TABLES

--显示当前用户所有分区表的信息：
SELECT * FROM USER_PART_TABLES

--显示表分区信息显示数据库所有分区表的详细分区信息：
SELECT * FROM DBA_TAB_PARTITIONS

--显示当前用户可访问的所有分区表的详细分区信息：
SELECT * FROM ALL_TAB_PARTITIONS

--显示当前用户所有分区表的详细分区信息：
SELECT * FROM USER_TAB_PARTITIONS

--显示子分区信息显示数据库所有组合分区表的子分区信息：
SELECT * FROM DBA_TAB_SUBPARTITIONS

--显示当前用户可访问的所有组合分区表的子分区信息：
SELECT * FROM ALL_TAB_SUBPARTITIONS

--显示当前用户所有组合分区表的子分区信息：
SELECT * FROM USER_TAB_SUBPARTITIONS

--显示分区列显示数据库所有分区表的分区列信息：
SELECT * FROM DBA_PART_KEY_COLUMNS

--显示当前用户可访问的所有分区表的分区列信息：
SELECT * FROM ALL_PART_KEY_COLUMNS

--显示当前用户所有分区表的分区列信息：
SELECT * FROM USER_PART_KEY_COLUMNS

--显示子分区列显示数据库所有分区表的子分区列信息：
SELECT * FROM DBA_SUBPART_KEY_COLUMNS

--显示当前用户可访问的所有分区表的子分区列信息：
SELECT * FROM ALL_SUBPART_KEY_COLUMNS

--显示当前用户所有分区表的子分区列信息：
SELECT * FROM USER_SUBPART_KEY_COLUMNS

--怎样查询出ORACLE数据库中所有的的分区表
SELECT * FROM USER_TABLES A WHERE A.PARTITIONED='YES'

--删除一个表的数据是
TRUNCATE TABLE TABLE_NAME;

--删除分区表一个分区的数据是
ALTER TABLE TABLE_NAME TRUNCATE PARTITION P5;

补充一个知识点：SQL Plus 与 PL/SQL 与 PL/SQL developer的区别？
SQL Plus：Oracle提供的接口，可以进行命令行操作；
PL/SQL：Oracle提供的过程化编程语言；
PL/SQL developer：可视化数据库操作小工具；