Oracle如何用单字段或多字段进行查重

博主在整理数据形成信用报告时发现重复数据多,整理了数据库去重方法。分为视图去重和表去重,介绍了单字段查重,利用rowid去重及查询重复数据语句;还提及多字段查重,通过取多个字段判断数据是否重复并去重。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在整理数据形成信用报告,发现重复的数据真的多,梳理都好久。我就做个笔记把去掉重复数据的方法整理下来。方便我后期查阅。

我将我目前已知的两种去重方法分为:视图去重和表去重。原理就是有无rowid这个字段。

单字段查重

表A:

IDnameusccmoney
1张飞11111100
2关羽22222100
3刘备33333300
4马超44444400
5张飞55555100
6马超44444400

这时候,我们来进行去重:如果只根据一个字段来去重的话,根据name字段,我们看下重复的有两条数据为‘张飞’和‘马超’

这个时候我们用最简单的方法rowid。通俗易懂

select * from 表A where rowid in(
select max(rowid) from  表A group by NAME)
order by id;
idnameusccmoney
1张飞11111100
2关羽22222100
3刘备33333300
4马超44444400

这个时候,数据就如上图所示。当name字段一样的时候,取rowid最大的保留。

上面那个是去重语句,下面说下查询表中的重复数据有哪些的语句

select * from 表A t,(select NAME from 表A group by NAME having count(1)>1) x
where t.NAME=x.NAME
order by t.id
idnameusccmoney
1张飞11111100
4马超44444400
5张飞55555100
6马超44444400

但是呢,有的时候我们使用多张表整合的视图,进行去重,这时候就没有rowid了。我们要怎么去重呢?

select  *  from  (select s.* from
(select t.*,row_number() over (partition by uscc order by uscc) as group_idx
from 表A t ) s
where s.group_idx = 1)

查询结果为:

idnameusccmoney
1张飞11111100
2关羽22222100
3刘备33333300
4马超44444400

多字段查重

我们取NAME和USCC两个字段进行查重,因为很多时候,数据判断是否重复并不是一个字段就可以了,而且通过两个,甚至是一整条数据是否完全相同进行查重,这时候我们就用下面这个语句

select  *  from  (select s.* from
(select t.*,row_number() over (partition by name,uscc order by name,uscc) as group_idx
from 表A t ) s
where s.group_idx = 1)

查询结果如下:

IDnameusccmoney
1张飞11111100
2关羽22222100
3刘备33333300
4马超44444400
5张飞55555100

ID=6的‘马超’这条数据进行了去重,因为这个条数据NAME和USCC都重复了,所以只取一条。

好记性不如烂笔头,虽然当时还记得怎么写,但是时间一长,就会忘记,如果没有良好的记录的习惯,下次还会百度找资料,很耽误时间。

转载于:https://www.cnblogs.com/jianshuai520/p/11058003.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值