如何通过SQL批量删除重复数据

本文介绍了SQL中GROUPBY和HAVING的基本概念,并提供了如何使用它们查询和删除数据库中重复数据的示例。作者分享了删除重复任务执行日志的方法,鼓励同行交流更多解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


前言

浅浅记录一下,工作问题。
今天在库中看到存在很多重复数据,本文将介绍怎么通过SQL语句批量删除重复数据的一种方式。


一、GROUP BY、HAVING是什么

我们先来了解一下GROUP BY,HAVING。
GROUP BY是SQL语言中的一种聚合函数。从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”;它的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理。在SQL中,GROUP BY是SELECT语句的可选子句,用于根据一个或多个字段对查询结果进行分组,它减少了结果集中的行数。
HAVING通常用在SQL语句中,与GROUP BY子句一起使用,对分组的结果进行过滤。如果将WHERE关键字用于在聚合运算前过滤分组的话,那么HAVING关键字则用于在聚合运算后过滤分组。

简而言之,ROUP BY用于按照一个或多个字段对查询结果进行分组,HAVING则是对分组之后的数据进行再次过滤

二、编写SQL

1.查询重复数据

代码如下(示例):

SELECT MIN( a.task_id ) id 
	FROM
		PLMS_T_D_TaskExecuteLog a 
	GROUP BY
		a.car_desc,
		a.direction,
		a.distance,
		a.log_begin_time,
		a.log_desc,
		a.log_status,
		a.mai_subName,
		a.person_str,
		a.weather 
HAVING
	COUNT ( * ) > 1

2.删除SQL

代码如下(示例):

DELETE 
FROM
	TaskExecuteLog 
WHERE
	task_id IN (
	SELECT MIN( a.task_id ) id 
	FROM
		PLMS_T_D_TaskExecuteLog a 
	GROUP BY
		a.car_desc,
		a.direction,
		a.distance,
		a.log_begin_time,
		a.log_desc,
		a.log_status,
		a.mai_subName,
		a.person_str,
		a.weather 
HAVING
	COUNT ( * ) > 1)

总结

以上就我通过SQL批量删除数据的语句,在此欢迎各位同行分享其他方式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

十一*

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值