网上五花八门删除重复数据的方法就是没见过这种:
DELETE FROM prod_grid_inc
WHERE ROWID IN (SELECT b.row_id2
FROM (SELECT ROWID row_id2,
a.*,
row_number() over(PARTITION BY a.prod_id ORDER BY a.insert_date DESC) row_num
FROM prod_grid_inc a) b
WHERE b.row_num >= 2);
大家不妨试试,经过试验,的确快了不少。
如果是几G的大表(这种时候一般是分区表),这种情况最好是append+nologging方式,将唯一记录insert到临时表中,然后通过交换分区的方式交换过去,前后只需要几分钟,其中临时表的表空间和索引表空间要符合正式表的要求:
eg:
INSERT /*+append*/ INTO ACCT_ITEM_MID
SELECT *
FROM ACCT_ITEM SUBPARTITION(P_201109_SUB_P_XX) a
WHERE ROWID = (SELECT MAX(ROWID)
FROM ACCT_ITEM SUBPARTITION(P_201109_SUB_P_XX) a1
WHERE a.cust_id = a1.cust_id);
COMMIT;
ALTER TABLE ACCT_ITEM EXCHANGE SUBPARTITION P_201109_SUB_P_XX WITH TABLE ACCT_ITEM_MID;
当然exchange的方式虽然快,但是这种情况会导致索引失效,需要重建索引:
alter index ind_name rebuild subpartition subpartition_name;
如此即可。
DELETE FROM prod_grid_inc
WHERE ROWID IN (SELECT b.row_id2
FROM (SELECT ROWID row_id2,
a.*,
row_number() over(PARTITION BY a.prod_id ORDER BY a.insert_date DESC) row_num
FROM prod_grid_inc a) b
WHERE b.row_num >= 2);
大家不妨试试,经过试验,的确快了不少。
如果是几G的大表(这种时候一般是分区表),这种情况最好是append+nologging方式,将唯一记录insert到临时表中,然后通过交换分区的方式交换过去,前后只需要几分钟,其中临时表的表空间和索引表空间要符合正式表的要求:
eg:
INSERT /*+append*/ INTO ACCT_ITEM_MID
SELECT *
FROM ACCT_ITEM SUBPARTITION(P_201109_SUB_P_XX) a
WHERE ROWID = (SELECT MAX(ROWID)
FROM ACCT_ITEM SUBPARTITION(P_201109_SUB_P_XX) a1
WHERE a.cust_id = a1.cust_id);
COMMIT;
ALTER TABLE ACCT_ITEM EXCHANGE SUBPARTITION P_201109_SUB_P_XX WITH TABLE ACCT_ITEM_MID;
当然exchange的方式虽然快,但是这种情况会导致索引失效,需要重建索引:
alter index ind_name rebuild subpartition subpartition_name;
如此即可。
本文介绍了一种快速删除数据库中重复数据的方法,使用ROWID结合窗口函数进行高效筛选,并提出了针对大表采用append+nologging方式及分区交换技术,最后讨论了索引重建的问题。
251

被折叠的 条评论
为什么被折叠?



