表分区和表空间

原创已于 2024-06-18 14:30:57 修改 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2024-05-24 16:38:55 首次发布

表分区更具体点的
 表分区详细sql实例
此文摘抄：
表空间及分区表的概念
表空间：是一个或多个数据文件的集合，所有的数据对象都存放在指定的表空间中，但主要存放的是表，所以称作表空间。表空间是物理内存上的存在，一张表可以有多个表分区。每个表分区都可以放在一个表空间中，所以一样表的实际存储可能在多个表空间中

SELECT tablespace_name,
       --max_m,
       --count_blocks free_blk_cnt,
       sum_m - nvl(sum_free_m, 0) used_M,
       nvl(sum_free_m, 0) sum_free_m_now,
       (nvl(sum_free_m, 0) + decode(sum_m_max, 0, sum_m, sum_m_max) - sum_m) sum_free_max,
       sum_m sum_m_now,
       decode(sum_m_max, 0, sum_m, sum_m_max) AS sum_m_max,
       round(100 * nvl(sum_free_m, 0) / sum_m, 2) || '%' AS pct_free_now,
       round(100 * (nvl(sum_free_m, 0) +
             decode(sum_m_max, 0, sum_m, sum_m_max) - sum_m) /
             decode(sum_m_max, 0, sum_m, sum_m_max),
             2) || '%' AS pct_free_max
  FROM (SELECT tablespace_name,
       round(sum(bytes) / 1024 / 1024, 2) AS sum_m,
       round(sum(decode(autoextensible, 'YES', decode(sign(maxbytes-bytes),1,maxbytes,bytes), bytes)) / 1024 / 1024,
             2) AS sum_m_max
  FROM dba_data_files
 GROUP BY tablespace_name),
       (SELECT tablespace_name AS fs_ts_name,
               --max(bytes) / 1024 / 1024 AS max_m,
               --count(blocks) AS count_blocks,
               round(sum(bytes / 1024 / 1024), 2) AS sum_free_m
          FROM dba_free_space
         GROUP BY tablespace_name)
 WHERE tablespace_name = fs_ts_name(+)
 ORDER BY round(100 * (nvl(sum_free_m, 0) +decode(sum_m_max, 0, sum_m, sum_m_max) - sum_m) /
                decode(sum_m_max, 0, sum_m, sum_m_max),2);

分区表：当表中的数据量不断增大，查询数据的速度就会变慢，应用程序的性能就会下降，这时就应该考虑对表进行分区。表进行分区后，逻辑上表仍然是一张完整的表，只是将表中的数据在物理上存放到多个表空间(物理文件上)，这样查询数据时，不至于每次都扫描整张表。

表分区的具体作用
Oracle的表分区功能通过改善可管理性、性能和可用性，从而为各式应用程序带来了极大的好处。通常，分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务，分区是构建千兆字节数据系统或超高可用性系统的关键工具。

***分区功能能够将表、索引或索引组织表进一步细分为段，这些数据库对象的段叫做分区。***每个分区有自己的名称，还可以选择自己的存储特性。从数据库管理员的角度来看，一个分区后的对象具有多个段，这些段既可进行集体管理，也可单独管理，这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是，从应用程序的角度来看，分区后的表与非分区表完全相同，使用 SQL DML 命令访问分区后的表时，无需任何修改。

什么时候使用分区表：

表的大小超过2GB。
 表中包含历史数据，新的数据被增加都新的分区中。

表分区有以下优点：

改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索速度。
 增强可用性：如果表的某个分区出现故障，表在其他分区的数据仍然可用；
 维护方便：如果表的某个分区出现故障，需要修复数据，只修复该分区即可；
 均衡I/O：可以把不同的分区映射到磁盘以平衡I/O，改善整个系统性能。

缺点：

已经存在的表没有方法可以直接转化为分区表。但是有几种方式可以间接完成这个操作

表分区的几种类型及操作方法
范围分区：
范围分区将数据基于范围映射到每一个分区，这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的，并且分区键经常采用日期。举个例子：你可能会将销售数据按照月份进行分区。
当使用范围分区时，请考虑以下几个规则：

1、每一个分区都必须有一个VALUES LESS THEN子句，它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
2、所有分区，除了第一个，都会有一个隐式的下限值，这个值就是此分区的前一个分区的上限值。
3、在最高的分区中，MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值，也可以理解为高于任何分区中指定的VALUE LESS THEN的值，同时包括空值。


例一：假设有一个CUSTOMER表，表中有数据200000行，我们将此表通过CUSTOMER_ID进行分区，每个分区存储100000行，我们将每个分区保存到单独的表空间中，这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码，如下：

CREATE TABLE CUSTOMER
 (
 CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
 FIRST_NAME VARCHAR2(30) NOT NULL,
 LAST_NAME VARCHAR2(30) NOT NULL,
 PHONEVARCHAR2(15) NOT NULL,
 EMAILVARCHAR2(80),
 STATUS CHAR(1)
 )
 PARTITION BY RANGE (CUSTOMER_ID)
 (
 PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
 PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
 )
例二：按时间划分

CREATE TABLE ORDER_ACTIVITIES
 (
 ORDER_ID NUMBER(7) NOT NULL,
 ORDER_DATE DATE,
 TOTAL_AMOUNT NUMBER,
 CUSTOTMER_ID NUMBER(7),
 PAID CHAR(1)
 )
 PARTITION BY RANGE (ORDER_DATE)
 (
 PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01,
 PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
 PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
 )
例三：MAXVALUE

CREATE TABLE RangeTable
 (
 idd INT PRIMARY KEY ,
 iNAME VARCHAR(10),
 grade INT
 )
 PARTITION BY RANGE (grade)
 (
 PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
 PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
 );
列表分区：
 该分区的特点是某列的值只有几个，基于这样的特点我们可以采用列表分区。

例一

CREATE TABLE PROBLEM_TICKETS
 (
 PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,
 DESCRIPTION VARCHAR2(2000),
 CUSTOMER_ID NUMBER(7) NOT NULL,
 DATE_ENTERED DATE NOT NULL,
 STATUS VARCHAR2(20)
 )
 PARTITION BY LIST (STATUS)
 (
 PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01,
 PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02
 )
例二

CREATE TABLE ListTable
 (
 id INT PRIMARY KEY ,
 name VARCHAR (20),
 area VARCHAR (10)
 )
 PARTITION BY LIST (area)
 (
 PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
 PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
 );
 )
散列分区：
 这类分区是在列值上使用散列算法，以确定将行放入哪个分区中。当列的值没有合适的条件时，建议使用散列分区。
 散列分区为通过指定分区编号来均匀分布数据的一种分区类型，因为通过在I/O设备上进行散列分区，使得这些分区大小一致。
 例一：

CREATE TABLE HASH_TABLE
 (
 COL NUMBER(8),
 INF VARCHAR2(100)
 )
 PARTITION BY HASH (COL)
 (
 PARTITION PART01 TABLESPACE HASH_TS01,
 PARTITION PART02 TABLESPACE HASH_TS02,
 PARTITION PART03 TABLESPACE HASH_TS03
 )
简写：

CREATE TABLE emp
 (
 empno NUMBER (4),
 ename VARCHAR2 (30),
 sal NUMBER
 )
 PARTITION BY HASH (empno) PARTITIONS 8
 STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数，Oracle中如果你要使用hash分区，只需指定分区的数量即可。建议分区的数量采用2的n次方，这样可以使得各个分区间数据分布更加均匀。

组合范围散列分区
这种分区是基于范围分区和列表分区，表首先按某列进行范围分区，然后再按某列进行列表分区，分区之中的分区被称为子分区。


CREATE TABLE SALES
 (
 PRODUCT_ID VARCHAR2(5),
 SALES_DATE DATE,
 SALES_COST NUMBER(10),
 STATUS VARCHAR2(20)
 )
 PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
 (
 PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
 (
 SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
 SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
 ),
 PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
 (
 SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
 SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
 )
 )

复合范围散列分区：
这种分区是基于范围分区和散列分区，表首先按某列进行范围分区，然后再按某列进行散列分区。


create table dinya_test
 (
 transaction_id number primary key,
 item_id number(8) not null,
 item_description varchar2(300),
 transaction_date date
 )
 partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
 (
 partition part_01 values less than(to_date(‘2006-01-01','yyyy-mm-dd')),
 partition part_02 values less than(to_date(‘2010-01-01','yyyy-mm-dd')),
 partition part_03 values less than(maxvalue)
 );

有关表分区的一些维护性操作：

 添加分区
 以下代码给SALES表添加了一个P3分区

ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意：以上添加的分区界限应该高于最后一个分区界限。

以下代码给SALES表的P3分区添加了一个P3SUB1子分区

ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
删除分区
 以下代码删除了P3表分区：

ALTER TABLE SALES DROP PARTITION P3;
在以下代码删除了P4SUB1子分区：

ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想删除此分区，必须删除表。

截断分区
 截断某个分区是指删除某个分区中的数据，并不会删除分区，也不会删除其它分区中的数据。当表中即使只有一个分区时，也可以截断该分区。通过以下代码截断分区：

ALTER TABLE SALES TRUNCATE PARTITION P2;
通过以下代码截断子分区：

ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
合并分区
 合并分区是将相邻的分区合并成一个分区，结果分区将采用较高分区的界限，值得注意的是，不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并：

ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
拆分分区
 拆分分区将一个分区拆分两个新分区，拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。

ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
接合分区(coalesca)
结合分区是将散列分区中的数据接合到其它分区中，当散列分区中的数据比较大时，可以增加散列分区，然后进行接合，值得注意的是，接合分区只能用于散列分区中。通过以下代码进行接合分区：

ALTER TABLE SALES COALESCA PARTITION;
重命名表分区
 以下代码将P21更改为P2

ALTER TABLE SALES RENAME PARTITION P21 TO P2;
相关查询
-- 跨分区查询
select sum( ) from
 (select count() cn from t_table_SS PARTITION (P200709_1)
 union all
 select count(*) cn from t_table_SS PARTITION (P200709_2)
 );

--查询表上有多少分区
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'

--查询索引信息
select object_name,object_type,tablespace_name,sum(value)
 from v$segment_statistics
 where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
 group by object_name,object_type,tablespace_name
 order by 4 desc

--显示数据库所有分区表的信息：
select * from DBA_PART_TABLES

--显示当前用户可访问的所有分区表信息:
select * from ALL_PART_TABLES

--显示当前用户所有分区表的信息：
select * from USER_PART_TABLES

--显示表分区信息 显示数据库所有分区表的详细分区信息：
select * from DBA_TAB_PARTITIONS

--显示当前用户可访问的所有分区表的详细分区信息：
select * from ALL_TAB_PARTITIONS

--显示当前用户所有分区表的详细分区信息：
select * from USER_TAB_PARTITIONS

--显示子分区信息 显示数据库所有组合分区表的子分区信息：
select * from DBA_TAB_SUBPARTITIONS

--显示当前用户可访问的所有组合分区表的子分区信息：
select * from ALL_TAB_SUBPARTITIONS

--显示当前用户所有组合分区表的子分区信息：
select * from USER_TAB_SUBPARTITIONS

--显示分区列 显示数据库所有分区表的分区列信息：
select * from DBA_PART_KEY_COLUMNS

--显示当前用户可访问的所有分区表的分区列信息：
select * from ALL_PART_KEY_COLUMNS

--显示当前用户所有分区表的分区列信息：
select * from USER_PART_KEY_COLUMNS

--显示子分区列 显示数据库所有分区表的子分区列信息：
select * from DBA_SUBPART_KEY_COLUMNS

--显示当前用户可访问的所有分区表的子分区列信息：
select * from ALL_SUBPART_KEY_COLUMNS

--显示当前用户所有分区表的子分区列信息：
select * from USER_SUBPART_KEY_COLUMNS

--怎样查询出oracle数据库中所有的的分区表
select * from user_tables a where a.partitioned='YES'

--删除一个表的数据是
truncate table table_name;

--删除分区表一个分区的数据是
alter table table_name truncate partition p5;

1、创建表分区

1.1、增加范围分区range partitioned table

ALTER TABLE range_Partition_Table ADD PARTITION PART_202010 VALUES LESS THAN (TO_DATE('2020-10-1 00:00:00','yyyy-mm-dd hh24:mi:ss'));
1.2、增加列表分区list partitioned table

ALTER TABLE list_Partition_Table ADD PARTITION PART_04 VALUES ('TE');
1.3、增加哈希分区hash partitioned table

ALTER TABLE hash_Partition_Table ADD PARTITION PART_03;
1.4、增加子分区subpartition

ALTER TABLE range_hash_Partition_Table MODIFY PARTITION PART_1 ADD SUBPARTITION PART_1_SUB_4;
2、修改表分区

2.1 列表分取增加分区数值（Adding Values for a List Partition）

ALTER TABLE  list_Partition_Table MODIFY PARTITION PART_04 ADD VALUES('MIS');
2.2、列表分取删除分区数值（Dropping Values from a List Partition）

ALTER TABLE  list_Partition_Table MODIFY PARTITION PART_04 DROP VALUES('MIS');
3、删除表分区

3.1、通用删除分区方式

ALTER TABLE table_name DROP PARTITION part_name;
3.2、对于哈希分表的删除需要特殊处理

-- 减少hash 分区的个数，一次减少一个。不能指定减少partition的名称。
ALTER TABLE hash_example COALESCE PARTITION ;
--subpartition 的语法对于如下
ALTER TABLE diving MODIFY PARTITION us_locations COALESCE SUBPARTITION;

查看组合分区建表脚本

在这里插入图片描述
在plsqldever中,只能看到组合分区表的表结构,看不到建表脚本,为了查看建表脚本,可以通过一个oracle自带的程序包来完成,具体操作sql如下:
SELECT DBMS_METADATA.GET_DDL(‘‘TABLE’’,‘‘TABLE_NAME’’,‘‘USER_NAME’’) FROM DUAL;
在上面的参数中,TABLE_NAME是被查询的表的名字,USER_NAME表归属的用户名字.
如果如上格式填写正确的参数,执行sql,就可以抓去到组合分区表的建表脚本.
如果执行如上sql的时候,出现如下错误:
ORA-31603: object “CP_EXT_PKGINFO_HIS_T” of type TABLE not found in schema
“SCHEMA”
ORA-06512: at “SYS.DBMS_SYS_ERROR”, line 105
ORA-06512: at “SYS.DBMS_METADATA_INT”, line 3209
ORA-06512: at “SYS.DBMS_METADATA_INT”, line 3594
ORA-06512: at “SYS.DBMS_METADATA_INT”, line 4483
ORA-06512: at “SYS.DBMS_METADATA”, line 326
ORA-06512: at “SYS.DBMS_METADATA”, line 410
ORA-06512: at “SYS.DBMS_METADATA”, line 449
ORA-06512: at “SYS.DBMS_METADATA”, line 615
ORA-06512: at “SYS.DBMS_METADATA”, line 1221
ORA-06512: at line 1
那么,请检查传入的三个参数,最应该注意的是最后一个参数,他是一个数据库用户名;有些参考书上将上面描述成SELECT DBMS_METADATA.GET_DDL(‘‘TABLE’’,‘‘TABLE_NAME’’,‘‘SCHEMA’’) FROM DUAL;
其实SCHEMA在oracle中就是一个oracle用户 (就是要查的表是属于哪个用户的，就写哪个用户)