sql去重

最新推荐文章于 2025-10-15 07:26:17 发布

原创最新推荐文章于 2025-10-15 07:26:17 发布 · 1.1w 阅读

9 ·

CC 4.0 BY-SA版权

数据库专栏收录该内容

12 篇文章

订阅专栏

本文分享了在数据库中高效去除重复记录的SQL语句，采用先创建包含重复记录最小ID的临时表，再通过比较ID大小的方式进行去重。同时介绍了使用DISTINCT和GROUP BY进行查询去重的方法及性能对比。

一.数据库清洗去重

在数据库里清洗时，会用到DELETE语句进行操作，很多时候需要删除重复记录保存，保存一条。百度之后有些语句会报错，直到发现一个在实战中可以用不会报错的，并且跑起来很快的一条sql语句

DELETE consum_record
FROM
 consum_record, 
 (
  SELECT
   min(id) id,
   user_id,
   monetary,
   consume_time
  FROM
   consum_record
  GROUP BY
   user_id,
   monetary,
   consume_time
  HAVING
   count(*) > 1
 ) t2
WHERE
 consum_record.user_id = t2.user_id 
 and consum_record.monetary = t2.monetary
 and consum_record.consume_time = t2.consume_time
AND consum_record.id > t2.id;

1.(SELECT min(id) id,user_id,monetary,consume_time FROM consum_record GROUP BY user_id,monetary,consume_time HAVING count(*) > 1 ) t2 将重复数据建一张临时表，集合里是重复记录的最小id