ROWID的使用——快速删除重复的记录

本文介绍如何使用Oracle数据库中的ROWID特性,通过创建临时表或结合MAX/MIN函数,高效地删除表中的重复记录。ROWID作为数据的详细地址,能够快速定位并处理大量重复数据,提供两种实用的SQL语句示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ROWID的使用——快速删除重复的记录

ROWID是数据的详细地址,通过rowid,oracle可以快速的定位某行具体的数据的位置。

ROWID可以分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid,索引组织表(IOT)的rowid是逻辑rowid。

当表中有大量重复数据时,可以使用ROWID快速删除重复的记录。

举例:

--建表tbl

SQL> create table stu(no number,name varchar2(10),sex char(2));

--添加测试记录

SQL> insert into stu values(1, 'ab',’男’);

SQL> insert into stu values(1, 'bb',’女’);

SQL> insert into stu values(1, 'ab',’男’);

SQL> insert into stu values(1, 'ab',’男’);

       SQL>commit;

 

删除重复记录方法很多,列出两种。

⑴ 通过创建临时表

可以把数据先导入到一个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:

SQL>create table stu_tmp as select distinct* from stu;

SQL>truncate table sut;                                                   //清空表记录

SQL>insert into stu select * from stu_tmp;                        //将临时表中的数据添加回原表

 

这种方法可以实现需求,但是很明显,对于一个千万级记录的表,这种方法很慢,在生产系统中,这会给系统带来很大的开销,不可行。

 

⑵ 利用rowid结合max或min函数

使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。

SQL>delete from stu a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex =b.sex);                                          //这里max使用min也可以

或者用下面的语句

SQL>delete from stu a where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex);      

//这里如果把max换成min的话,前面的where子句中需要把"<"改为">"

跟上面的方法思路基本是一样的,不过使用了group by,减少了显性的比较条件,提高效率。

SQL>delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex );

思考:若在stu表中唯一确定任意一行数据(1, 'ab',’男’),把sex字段更新为”女”,怎么做?

       SQL>update stu set sex=’女’ where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);

理解:当想要得到唯一值的时候就可以考虑使用rowid来进行处理

### 删除数据库或数据表中的重复记录 在实际应用中,删除数据库表中的重复记录是一个常见需求。以下是针对此问题的具体解决方和技术细节。 #### 使用 SQL 语句直接删除重复记录 当需要从表中移除重复项时,可以根据特定字段进行筛选并保留唯一的一条记录。例如,如果希望依据 `peopleId` 字段来判定哪些记录属于重复项,并且只留下具有最小 `rowid` 的那一条记录,则可执行以下命令: ```sql DELETE FROM your_table_name WHERE rowid NOT IN ( SELECT MIN(rowid) FROM your_table_name GROUP BY peopleId ); ``` 该语句通过子查询找出每个 `peopleId` 对应的最小 `rowid` 值集合,再以此为基础剔除掉不符合条件的所有行[^1]。 #### Oracle 数据库下的操作方案 对于运行于 Oracle 平台上的场景而言,同样存在多种策略可用于定位与清除冗余信息。比如借助分析函数 ROW_NUMBER() 来标记每一组内的成员次序号,进而方便后续过滤逻辑的设计: ```sql WITH CTE AS( SELECT *, ROW_NUMBER() OVER(PARTITION BY column_for_check ORDER BY some_order_column) rn FROM target_table ) DELETE FROM CTE WHERE rn > 1; ``` 这里定义了一个公用表达式 (CTE),它会按照指定列(如 `column_for_check`)分区,并赋予各分区内项目唯一的顺序编号;之后只需简单地删那些排名大于一者即可达成目标[^2]。 另外还有一种更为传统的方式——先建立辅助中间表暂存无冲突版本的数据副本,接着清空源表后再重新填充回,最后销毁过渡载体完成整个流程。这种方虽然稍显繁琐但却兼容性强,尤其适合复杂情形下使用[^3]。 #### 高效检索重复条目技巧 除了单纯实施清理动作外,有时我们可能还需要提前知晓究竟有哪些地方存在问题以便进一步确认调整方向。此时可以运用如下几种手段快速获取相关信息: - **基础版** ```sql SELECT col_with_possible_dups, COUNT(*) FROM tbl_to_inspect GROUP BY col_with_possible_dups HAVING COUNT(*) > 1; ``` - **改进型** 若考虑到可能存在多列组合形成的关键属性集,则需相应扩展聚合维度范围: ```sql SELECT c1,c2,...cn,COUNT(*) FROM tbnm GROUP BY c1,c2,...cn HAVING COUNT(*)>1 ; ``` 以上两种形式均能有效地帮助识别潜在风险区域,从而为进一步采取措施奠定良好基础[^4]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值