三种办法将普通表改为分区表

本文介绍了将Oracle普通表转换为分区表的三种高效方法:重建分区表、交换分区及使用在线重定义功能。每种方法都有详细的步骤说明及优缺点分析。

Oracle的普通表没有办法通过修改属性的方式直接转化为分区表,必须通过重建的方式进行转变,下面介绍三种效率比较高的方法,并说明它们各自的特点。

方法一:利用原表重建分区表。

步骤:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE); 

表已创建。 

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS; 

已创建6264行。 

SQL> COMMIT; 

提交完成。 

SQL> CREATE TABLE T_NEW (ID, TIME) PARTITION BY RANGE (TIME) 

  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')), 

  3  PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')), 

  4  PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')), 

  5  PARTITION P4 VALUES LESS THAN (MAXVALUE)) 

  6  AS SELECT ID, TIME FROM T; 

表已创建。 

SQL> RENAME T TO T_OLD; 

表已重命名。 

SQL> RENAME T_NEW TO T; 

表已重命名。 

SQL> SELECT COUNT(*) FROM T; 

  COUNT(*) 

---------- 

      6264 

SQL> SELECT COUNT(*) FROM T PARTITION (P1); 

  COUNT(*) 

---------- 

         0 

SQL> SELECT COUNT(*) FROM T PARTITION (P2); 

  COUNT(*) 

---------- 

      6246 

SQL> SELECT COUNT(*) FROM T PARTITION (P3); 

  COUNT(*) 

---------- 

        18 


优点:方法简单易用,由于采用DDL语句,不会产生UNDO,且只产生少量REDO,效率相对较高,而且建表完成后数据已经在分布到各个分区中了。

不足:对于数据的一致性方面还需要额外的考虑。由于几乎没有办法通过手工锁定T表的方式保证一致性,在执行CREATE TABLE语句和RENAME T_NEW TO T语句直接的修改可能会丢失,如果要保证一致性,需要在执行完语句后对数据进行检查,而这个代价是比较大的。另外在执行两个RENAME语句之间执行的对T的访问会失败。

适用于修改不频繁的表,在闲时进行操作,表的数据量不宜太大。

方法二:使用交换分区的方法。

步骤:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE); 

表已创建。 

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS; 

已创建6264行。 

SQL> COMMIT; 

提交完成。 

SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME) 

  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')), 

  3  PARTITION P2 VALUES LESS THAN (MAXVALUE)); 

表已创建。 

SQL> ALTER TABLE T_NEW EXCHANGE PARTITION P1 WITH TABLE T; 

表已更改。 

SQL> RENAME T TO T_OLD; 

表已重命名。 

SQL> RENAME T_NEW TO T; 

表已重命名。 

SQL> SELECT COUNT(*) FROM T; 

  COUNT(*) 

---------- 

      6264


 

优点:只是对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,效率最高。如果对数据在分区中的分布没有进一步要求的话,实现比较简单。在执行完RENAME操作后,可以检查T_OLD中是否存在数据,如果存在的话,直接将这些数据插入到T中,可以保证对T插入的操作不会丢失。

不足:仍然存在一致性问题,交换分区之后RENAME T_NEW TO T之前,查询、更新和删除会出现错误或访问不到数据。如果要求数据分布到多个分区中,则需要进行分区的SPLIT操作,会增加操作的复杂度,效率也会降低。

适用于包含大数据量的表转到分区表中的一个分区的操作。应尽量在闲时进行操作。

方法三:Oracle9i以上版本,利用在线重定义功能

原理:

Oracle 在线重定义表

步骤:

1)Check 原表A 是否可以重定义

   EXECUTE dbms_redefinition.can_redef_table (user, 'table_name');

2)创建一个中间表B,其结构是你想要对表A进行重定义的最终结构。这里的结构指表列结构、

     主键(必须),不包含索引,约束,触发器,用户权限等;

3)关联中间表 B 与原表 A

   EXECUTE dbms_redefinition.start_redef_table ('user', 'A', 'B', COL_MAPPING, OPTIONS_FLAG);

   此时,oracle 会创建一个物化视图,将原表A的所有数据拷贝到中间表B中。此过程不会影响用户对A表的访问。

主要参数:

UNAME        VARCHAR2 IN

ORIG_TABLE   VARCHAR2 IN

INT_TABLE    VARCHAR2 IN

COL_MAPPING  VARCHAR2 IN DEFAULT

OPTIONS_FLAG BINARY_INTEGER IN DEFAULT

ORDERBY_COLS VARCHAR2 IN DEFAULT

PART_NAME    VARCHAR2 IN DEFAULT

其中:

COL_MAPPING:列的映射关系。默认所有包括在中间表中的列用于表的重定义。如果给出了映射方法,则只考虑映射方法中给出的列;

OPTIONS_FLAG:重定义的方法,默认基于主键。dbms_redefinition.cons_use_pk和dbms_redefinition.cons_use_rowid。

4)在中间表B上创建所需的索引,约束,触发器,用户权限等

5)用中间表redefine原表

   Exec dbms_redefinition.finish_redef_table(‘user’, 'A', 'B’);

   oracle会根据step 3)的物化视图,把原表A的最新数据增量更新到中间表B;然后在数据字典中把原表和中间表对换,对换的过程原表A将处于锁状态(排它锁)。结束后,中间表B重命名成了原表A。此时可以删除中间表B。

   如果在执行dbms_redefinition.start_redef_table()过程和执行dbms_redefinition.finish_redef_table()过程直接在重定义表上执行了大量的DML操作,那么可以选择执行一次或多次的sync_interim_table()过程,以减少最后一步执行finish_redef_table()过程时的锁定时间。

例子:

SQL> CREATE TABLE T(ID  PRIMARY KEY ,TIME ) AS SELECT ROWNUM ,CREATED FROM DBA_OBJECTS;
 
Table created
 
SQL> EXEC DBMS_REDEFINITION.can_redef_table('HELIOS','T', DBMS_REDEFINITION.cons_use_pk);
 
PL/SQL procedure successfully completed

SQL> 
SQL>  CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)
  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')),
  3  PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),
  4  PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),
  5  PARTITION P4 VALUES LESS THAN (MAXVALUE));
Table created


SQL> EXEC DBMS_REDEFINITION.start_redef_table(uname => 'HELIOS',orig_table => 'T',int_table => 'T_NEW');
 
PL/SQL procedure successfully completed
 
SQL> EXEC DBMS_REDEFINITION.FINISH_redef_table(uname => 'HELIOS',orig_table => 'T',int_table => 'T_NEW');
 
PL/SQL procedure successfully completed


优点:保证数据的一致性,在大部分时间内,表T都可以正常进行DML操作。只在切换的瞬间锁表,具有很高的可用性。这种方法具有很强的灵活性,对各种不同的需要都能满足。而且,可以在切换前进行相应的授权并建立各种约束,可以做到切换完成后不再需要任何额外的管理操作。

不足:实现上比上面两种略显复杂。

适用于各种情况。

<think>好的,我现在需要帮助用户解决在GaussDB中将现有普通转换为分区表的问题。首先,我得回顾一下用户提供的引用内容,特别是引用[1]和[2],因为它们直接提到了普通分区表的方法和分区表的优势。 根据引用[1],转换步骤包括创建分区表、导入数据、验证、删除原和重命名。不过用户可能想知道具体的GaussDB语法和注意事项。我需要确认GaussDB是否支持类似PostgreSQL的分区语法,比如CREATE TABLE ... PARTITION BY。同时,引用[3]提到了创建全局索引,可能在分区表中索引的处理需要特别注意,比如全局索引和本地索引的区别。 接下来,用户提到的注意事项可能包括数据验证、索引重建、业务影响等。引用[4]讨论了存储类型,可能涉及转换后的存储优化,比如列存分区表的优势。此外,引用[5]提到解码性能,虽然不直接相关,但要注意在数据迁移过程中可能对复制或日志的影响。 需要分步骤详细说明,例如创建分区表时使用正确的分区键和策略,可能使用范围分区或列分区。数据导入时,使用INSERT INTO ... SELECT语句,但要注意事务处理,避免锁时间过长。验证数据时,检查行数、关键字段一致性等。删除原前必须确保备份,或者使用重命名来替换名,减少业务中断。 还要注意在转换过程中的锁机制,是否允许在线操作,或者是否需要停机时间。索引方面,原的索引是否需要重新创建在分区表上,全局索引是否需要调整。例如,引用[3]中的GLOBAL索引例子,可能需要特别处理。 另外,分区表维护的优势如引用[2]所述,改善查询性能、可用性和维护方便,这些可以作为注意事项中的优点。同时,提醒用户在转换后测试性能,确保查询优化器能正确利用分区剪裁等功能。 可能还需要考虑存储参数,比如分区表空间设置,或者是否使用列存储(引用[4]),但用户的问题是关于分区表,所以主要关注分区策略。此外,权限问题,确保新分区表有和原相同的权限。 总结步骤:创建分区结构、迁移数据、处理依赖对象(索引、触发器、权限)、验证、切换名。注意事项包括事务大小、性能影响、测试环境验证、备份等。需要将这些内容用中文清晰达,并引用相关引用作为支持。</think>在GaussDB中将普通转换为分区表需遵循以下步骤及注意事项,结合引用内容具体说明如下: --- ### **一、转换方法** #### **步骤1:创建分区表** - 使用`CREATE TABLE ... PARTITION BY`定义分区策略(如范围、列、哈希)。 例如,按时间范围分区: ```sql CREATE TABLE new_part_table (id INT, create_date DATE) PARTITION BY RANGE (create_date) ( PARTITION p2023 VALUES LESS THAN ('2024-01-01'), PARTITION p2024 VALUES LESS THAN ('2025-01-01') ); ``` #### **步骤2:导入数据** - 通过`INSERT INTO ... SELECT`迁移数据: ```sql INSERT INTO new_part_table SELECT * FROM original_table; ``` 若数据量大,建议分批次提交事务以避免长事务阻塞[^5]。 #### **步骤3:数据验证** - 检查行数一致性: ```sql SELECT COUNT(*) FROM original_table; SELECT COUNT(*) FROM new_part_table; ``` - 比对关键字段的分布是否匹配。 #### **步骤4:处理依赖对象** - **重建索引**:原索引需在分区表上重新创建。若需全局索引(GLOBAL INDEX),需显式指定[^3]: ```sql CREATE INDEX idx_global ON new_part_table(id) GLOBAL; ``` - **同步权限与触发器**:重新授权用户权限,并迁移触发器、约束等。 #### **步骤5:替换原** - 删除原(可选): ```sql DROP TABLE original_table; ``` - 重命名分区表以继承原名: ```sql ALTER TABLE new_part_table RENAME TO original_table; ``` --- ### **二、注意事项** 1. **业务停机时间** 数据迁移期间可能锁,建议在低峰期操作或使用在线迁移工具。 2. **存储优化** 若需提升查询效率,可结合列存储(如HStore)压缩数据[^4]。 3. **分区键选择** 选择高频查询条件字段作为分区键,以利用分区剪裁提升性能[^2]。 4. **索引兼容性** 分区表的本地索引(LOCAL INDEX)仅作用于单个分区,全局索引需单独维护。 5. **回退方案** 操作前备份原数据,若迁移失败可快速恢复。 --- ### **三、示例完整流程** ```sql -- 1. 创建分区表 CREATE TABLE sales_part (id INT, sale_date DATE, amount NUMERIC) PARTITION BY RANGE (sale_date) ( PARTITION p2023 VALUES LESS THAN ('2024-01-01'), PARTITION p2024 VALUES LESS THAN ('2025-01-01') ); -- 2. 迁移数据 BEGIN; INSERT INTO sales_part SELECT * FROM sales; COMMIT; -- 3. 重建索引 CREATE INDEX idx_sales_date ON sales_part(sale_date) LOCAL; -- 4. 替换原 ALTER TABLE sales RENAME TO sales_old; ALTER TABLE sales_part RENAME TO sales; ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值