oralce sql去重

最新推荐文章于 2022-06-23 16:38:39 发布

原创最新推荐文章于 2022-06-23 16:38:39 发布 · 267 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

数据库专栏收录该内容

39 篇文章

订阅专栏

本文介绍两种有效去除数据库中重复记录的方法：使用GROUP BY配合HAVING子句筛选特定字段的重复记录，以及利用ROW_NUMBER()窗口函数按指定字段进行排序并标记，适用于不同场景的数据处理需求。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第一种方法：

用distinct关键字只能过滤查询字段中所有记录相同的（记录集相同），而如果要指定一个字段却没有效果，另外distinct关键字会排序，效率很低。

select distinct name from t1 能消除重复记录，但只能取一个字段，现在要同时取id,name这2个字段的值。

select distinct id,name from t1 可以取多个字段，但只能消除这2个字段值全部相同的记录

所以用distinct达不到想要的效果，用group by 可以解决这个问题。

例如要显示的字段为A、B、C三个，而A字段的内容不能重复可以用下面的语句：

select A, min(B),min(C),count(*) from [table] where [条件] group by A

having [条件] order by A desc

为了显示标题头好看点可以把select A, min(B),min(C),count(*) 换称select A as A, min(B) as B,min(C) as C,count(*) as 重复次数

显示出来的字段和排序字段都要包括在group by 中

但显示出来的字段包有min,max,count,avg,sum等聚合函数时可以不在group by 中

如上句的min(B),min(C),count(*)

一般条件写在where 后面

有聚合函数的条件写在having 后面

如果在上句中having加 count(*)>1 就可以查出记录A的重复次数大于1的记录

如果在上句中having加 count(*)>2 就可以查出记录A的重复次数大于2的记录

如果在上句中having加 count(*)>=1 就可以查出所有的记录，但重复的只显示一条，并且后面有显示重复的次数----这就是所需要的结果，而且语句可以通过hibernate

下面语句可以查询出那些数据是重复的：

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

将上面的>号改为=号就可以查询出没有重复的数据了。

例如 select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having

count(*)>=1 order by GKRQ)

select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by

gcmc ) order by gkrq desc ---还是这个可行。

有一面试题说：distinct去重复的效率很底下，我在网上看到这遍文章的方法好像说是用 group by having 效率很高了？

我在了一个测试，有一商品表，26万条记录，只有商品编号建了索引，对品牌名称字段做 distinct

select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1

平均时间是：0.453

select distinct brand from tab_commbaseinfo

平均时间是：0.39

搞不懂是否还有其它方法.

第二种方法：

select ROW_NUMBER() over(order by id1) odid,* from #t1
select ROW_NUMBER() over(partition by id1 order by id1) odid,* from #t1
select ROW_NUMBER() over(partition by id1,id2 order by id1) odid,* from #t1
select ROW_NUMBER() over(partition by id1,id2,id3 order by id1) odid,* from #t1

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。