关于Oracle去除重复的问题

本文将展示如何利用Oracle的row_number()over函数来识别和删除数据库表中的重复记录,并通过示例演示如何在SQL查询中应用此功能。此外,文章还介绍了使用distinct关键字来过滤重复数据的方法,以及如何在查询中正确使用distinct以避免常见的错误。通过实例分析,读者可以掌握在不同场景下高效地管理数据库重复数据的技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1):Oracle的row_number() over函数消除重复的记录

例子:

1.select d.id,d.outer_code from dict_depts_source d order by outer_code(查看重复数据)

2.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(标识重复数据)

3.delete from dict_depts_source where id in(
select id from(select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d)t
where t.row_flag > 1)(删除重复数据)

3.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(检查删除效果)

 row_number() over ([partition by col1] order by col2) ) as 别名
表示根据col1分组,在分组内部根据 col2排序
而这个“别名”的值就表示每组内部排序后的顺序编号(组内连续的唯一的),[partition by col1] 可省略。

2)

distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用 它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。

下面先来看看例子:

table表

字段1 字段2
id name
1 a
2 b
3 c
4 c
5 b

库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。

比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。

select distinct name from table
得到的结果是:

 

----------

name
a
b
c

好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:

select distinct name, id from table

 结果会是:

----------

id name
1 a
2 b
3 c
4 c
5 b

distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。

我们再改改查询语句:

select id, distinct name from table

 

很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。

------------------------------------------------------------------------------------------------------------

下面方法可行:

select *, count(distinct name) from table group by name

 结果:

id name count(distinct name)
1 a 1
2 b 1
3 c 1

最后一项是多余的,不用管就行了,目的达到。。。。。

group by 必须放在 order by 和 limit之前,不然会报错

 

 项目中实际用到的  例如从重复记录里面只取一条记录

1.SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS
2.SELECT * FROM (SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS GOODS) WHERE ROW_FLAG = 1

  PARTITION BY 后面的 PACTID 为重复字段

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值