【Stackoverflow好问题】SQL中去除重复行

最新推荐文章于 2025-03-31 14:39:24 发布

翻译最新推荐文章于 2025-03-31 14:39:24 发布 · 1.9k 阅读

文章标签：

#sql #stackoverflow #去重

Stackoverflow问题精选同时被 3 个专栏收录

18 篇文章

订阅专栏

stackoverflow问题精选-Java篇

16 篇文章

订阅专栏

SQL

4 篇文章

订阅专栏

本文介绍了一种在大型数据表中快速去除重复行的有效方法。通过使用SQL的GROUP BY和MIN/MAX函数结合子查询，可以高效地保留每组数据中的特定行并删除其余重复项。

问题

假设有一个数据量比较大的表（例如300,000+行），其中有重复的行（除了主键外，其他的列数据是一样的），如何快速去重呢？

我的表类似这样

MyTable
-----------
RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

精华回答

假设没有null值，你可以先对其他列做group by，然后只保留MIN或者MAX(RowId),删除其他行：

DELETE MyTable 
FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

如果RowId不是int类型，而是个GUID，则可以用

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))

stackoverflow链接：

http://stackoverflow.com/questions/18932/how-can-i-remove-duplicate-rows

专栏介绍：

非常喜欢stackoverflow，总能在上面找到疑难杂症的解决办法。偶然发现该网站有一个热度榜单。于是精选了热度较高的一些问题，然后按照自己的理解，把大家的讨论梳理出来。因此，这些文章不是真正的翻译，而是按照自己的理解做了一些增删、润色，希望能把上面的讨论，更精简有效地分享给大家。

如需转载，请注明原文地址

http://blog.youkuaiyun.com/lizeyang

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lizeyang

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

二、SQLServer 的适配记录

空空说技术的博客

04-23

892

这里，使用的工具是navicat，连接了SQLSERVER数据库，上诉基本上就是在适配企业项目的时候，遇到的问题了，本教程不是给你提供源代码，适配这种事都是问题的解决，代码的改造，提供更多问题和解决方便供大家参考，才是最有利的方式！然后代码中的SQL语句是小写的，在mysql下设置大小写忽略的，所有可以通用。但在SQLSERVER中默认是对大小写严格的，因此用不了。

SQL INNER JOIN 连接和SQL UNION连接

最新发布

xiaoaque的博客

04-04

1468

JOIN 类型返回内容INNER JOIN两个表的交集部分，匹配的记录LEFT JOIN左表的所有记录，以及匹配的右表记录RIGHT JOIN右表的所有记录，以及匹配的左表记录两个表的并集部分，包含匹配和未匹配记录。

参与评论您还未登录，请先登录后发表或查看评论

堆栈 316. 去除重复字母

BLUEsang的博客

06-14

195

316. 去除重复字母给你一个仅包含小写字母的字符串，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例 1: 输入: "bcabc" 输出: "abc" 示例 2: 输入: "cbacdcbc" 输出: "acdb" 解题用string代替堆栈；（1）若在栈中找到正在遍历的字符，跳过；（2）若正在遍历的字符小于栈顶，且正在遍历的字符后面还有栈顶相同的元素，栈顶出栈；（while）（3）新字符入栈； class Soluti

118 stackoverflow高票系列 -- sql注入

fancivez的专栏

11-25

484

http://stackoverflow.com/questions/60174/how-can-i-prevent-sql-injection-in-php How can I prevent SQL-injection in PHP? If user input is inserted without modification into an SQL query,

Spark SQL报错：java.lang.StackOverflowError（栈溢出）原因及解决方案

qq_45124566的博客

04-18

2676

Spark SQL报错：java.lang.StackOverflowError

StackOverflow异常（别随意在数据库造数据了）

疯狂的蜗牛

08-25

548

背景测试报了一个异常过来，说功能不正常了，pdf无法制作成功。异常现象可以发现，同一个操作打印出来的异常堆栈信息还不一样，估计不是业务代码问题，可以为啥会栈溢出呢？这有点新鲜。问题发现 1、和运行环境有关系吗？叫测试试一下其他测试环境，看是否能复现这个问题？答：能复现。说明不是环境问题。 2、那我试试远程debug一下，看看到底问题出在哪？问题第一次出现在docker环境下，在docker中的tomcat下catalina.sh加上 CATALINA_OPTS="-Xdebug -X

StackOverFlow异常记录

topdeveloperr的博客

08-19

797

在写cglib动态代理实现aop的代码的时候，发现运行测试程序报出了stackoverflow异常，话不多说直接上代码： CGLibProxy实现如下： import net.sf.cglib.proxy.Enhancer; import net.sf.cglib.proxy.MethodInterceptor; import net.sf.cglib.proxy.MethodProxy; ...

Mysql中存储UUID去除横线的方法

12-15

通常用UUID做唯一标识，需要在数据库中进行存储。 UUID的格式代码如下: String string = UUID.randomUUID().toString(); System.out.println(“uuid:” + string); uuid:05ba463f-1dab-471f-81c7-58e0b06f35f0 ...

SQL UNION 操作符

xiaoaque的博客

03-31

713

SQL UNION 操作符合并两个或多个 SELECT 语句的结果。UNION 操作符用于合并两个或多个 SELECT 语句的结果集。它可以从多个表中选择数据，并将结果集组合成一个结果集。使用 UNION 时，每个 SELECT 语句必须具有相同数量的列，且对应列的数据类型必须相似。

《深入浅出Apache Spark》系列⑤：Spark SQL的表达式优化

datacreating的博客

12-16

1261

随着数据量的快速增长，传统的数据处理方法难以满足对计算速度、资源利用率以及查询响应时间的要求。为了应对这些挑战，Spark SQL引入了多种优化技术，以提高查询效率，降低计算开销。本文从表达式层面探讨了Spark SQL的优化手段，重点分析了三个方面。

Laravel-Overflow:Laravel Overflow包将允许轻松地向表单请求中添加一个溢出列。使用此程序包可以轻松地将溢出请求值存储在数据库表的JSON或Text列中

05-23

Laravel溢出 Laravel Overflow包将允许轻松地向表单请求中添加一个溢出列。使用此程序包可以轻松地将溢出请求值存储在数据库表的JSON或Text列中：）安装您可以通过composer安装该软件包： composer require craftlogan/laravel-overflow 用法建立模型您应该创建一个将使用溢出方法的模型。 php artisan make:model TestModel -m -m选项使用模型生成数据库迁移。 <?php namespace App ; use Illuminate \ Database \ Eloquent \ Model ; class TestModel extends Model { protected $ guarded

overlay无修改版

07-08

专门用于PE修复，附加数据的复制，即overlay的复制修复等。

python 远程统计文件代码分享

09-22

享一个Python获取远程文件大小的函数代码，简单实用，是学习Python编程的基础实例。

12-26

houyanhua1的专栏

10-30

12万+

new document div{ width:300px; height:200px; border:1px solid green; overflow:hidden;} /* overflow溢出，hidden隐藏，scroll滚动条，auto自动 */ 生活没有彩排，人生也没有彩排。总会有些时候，满心期待换来的是失望，或者是

html css3风车,css3 animation实现风车转动

weixin_36274779的博客

06-17

932

项目中经常有用到动画效果，比如Loading、风车转动等等。最简单的办法是使用gif，但是gif在半透明背景下有白边，体验不友好，好在现在可以使用css3的anmiation来实现动画效果，极大的提升了用户体验。下面是风车转动效果实现demo风车 - css3动画示例.windmill {110px;height: 160px;overflow: hidden;background: url(ht...

内容溢出：overflow

weixin_43734012的博客

11-28

7万+

overflow: visible:默认值。内容不会被修建，会呈现在盒子之外 hidden:内容会被修剪，并且其余内容是不可见的 scroll:内容会被修剪，但是浏览器会显示滚动条以便查看其余内容 auto：如果内容被修剪，则浏览器会显示滚动条以便查看 overflow：hidden和clear:both区别： overflow：hidden;作用在父元素，清除父元素内部所有浮动元素 clear:...

overflow溢出处理

路漫漫~

05-03

5万+

overflow 属性规定当内容溢出元素框时发生的事情 overflow: hidden:隐藏 visible:出现，默认 scroll:滚动条 auto:自动隐藏出现滚动条 IE存在一个bug，当宽高特别小的时候显示效果不一致，可以使用overfollow:hidden来处理。为了保证不出问题，在reset.css的.cls 下添加 overfollow:hid

【报错】StackOverflow问题定位和解决

开发随笔-猫咪酱

11-08

2128

stackoverflow最可能出现的问题就是循环调用。根据日志中调用推断出循环调用方法。

在Slack中实时获取StackOverFlow特定问题的更新

资源摘要信息:"StackOverFlowNewQuestionsToSlack是一个项目，旨在帮助用户在Slack中实时关注并接收StackoverFlow上特定问题的更新通知。该项目基于Azure Functions平台构建，具有定时触发机制，每天执行一次，使得...