sql查重、去重(留一)

最新推荐文章于 2025-04-04 21:39:26 发布

法.兀

最新推荐文章于 2025-04-04 21:39:26 发布

阅读量5k

点赞数 3

文章标签：数据库

本文链接：https://blog.youkuaiyun.com/m0_51079637/article/details/119829083

版权

前言

当我们的项目上线后就会发现用户并不会按照预想设想的方式去使用，因此提前设置好的检查代码并不会完全拦住用户的违规操作。因此，经常会出现重复的数据。而对于我正在维护的项目来说，一旦出现重复数据就是致命的问题，因为他要进行金额的核算。因此掌握sql查重、去重的操作是必备的。

PS：接手这个项目要做的第一个任务就是查询导入数据的时候出现了重复。

一、sql查重

重复数据分为两种情况：一是，整条数据一摸一样包括id，当然这种情况很少出现；二是，用来判断数据唯一性的字段出现了重复，比如存储人员信息的表格中姓名和身份证号码出现了两条数据，导致在计算该用户的金额的时候系统报错

SELECT name, id_card,count(*) as num
FROM user
WHERE 1=1  GROUP BY name,id_card HAVING count(*)>1;

select出的只能是group by分组的字段，这个的原因大概是因为其他字段有不重复的无法判断出应该显示哪个字段.

使用该语句就可显示出重复的数据，主要利用的是group by 分组的功能对指定字段进行分组

二、sql去重

查出重复数据后就要对重复数据进行清除，但是我们还需保留一条数据用于后续的操作处理，因此去重时还要保留一条数据

delete from user a where (a.name, a.id_card) in (
	select name, id_card 
	from user 
	group by name,id_card 
	having count(*) >1
) and rowid not in (
	select max(rowid) 
	from user 
	group by name,id_card 
	having count(*) >1
)