如何删除Table中的重复行

SQL去重技巧
本文介绍了在SQL Server 2005中使用NOW_NUMBER和CTE处理表中重复数据的方法,包括删除重复项、保留唯一记录及选择不重复数据的具体实现。

在写SQL的时候经常会有这样的需求: 在一个Table中会有多条重复的数据,如何有效的取出来不重复的数据,或者是删除掉重复的数据,或者取出某列重复值的第一条数据.

利用SQL Server 2005的新功能NOW_NUMBER和CTE可以很好的实现.

举例说明如下:

建立测试数据:

 

ContractedBlock.gifExpandedBlockStart.gif代码
create table Dup1
(
Col1
int null,
Col2
varchar(20) null
)

insert into Dup1 values
(
1, 'aaa'),
(
2, 'aaa'),
(
2, 'aaa'),
(
2, 'aaa'),
(
3, 'bbb'),
(
3, 'bbb'),
(
4, 'ccc'),
(
4, 'ddd'),
(
5, 'eee')

select * from Dup1

 

可以查看到重复的数据有:

SELECT Col1, Col2, COUNT(*) AS DupCount
FROM Dup1
GROUP BY Col1, Col2
HAVING COUNT(*) > 1

2010060713515115.jpg

 

接下来介绍如何delete掉重复的数据:

1.NOW_NUMBER:SQL Server 2005添加了很好用的RANKING函数(NOW_NUMBER,RANK,DENSE_RANK,NTILE),利用NOW_NUMBER()OVER(PARTITION GY)最为直接,也最为方便,不能修改表或者产生多余的列.

 首先会分配一个列号码,以Col1,Col2组合来分区排序.

SELECT Col1, Col2,
ROW_NUMBER()
OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rn
FROM Dup1

 

 

得到的序号如下:

2010060714030766.jpg 

很明显的是重复列都分组分割排序,只需要delete掉排序序号>1的即可.

 

--用到CTE
WITH DupsD
AS (
SELECT Col1, Col2,
ROW_NUMBER()
OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rn
FROM Dup1
)
DELETE DupsD
WHERE rn > 1;
--或者
DELETE A FROM (
SELECT Col1, Col2,
ROW_NUMBER()
OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rn
FROM Dup1) A WHERE A.rn>1

 

2.创建一个标识键唯一的表记一列.

 

ALTER TABLE dbo.Dup1
ADD
PK
INT IDENTITY
NOT NULL
CONSTRAINT PK_Dup1 PRIMARY KEY;
SELECT *
FROM Dup1;

 

 

删除找出与Col1,Col2相同并且比Dup1.PK大的记录,也就是保留重复值中PK最小的记录.

DELETE Dup1
WHERE EXISTS ( SELECT *
FROM Dup1 AS D1
WHERE D1.Col1 = Dup1.Col1
AND D1.Col2 = Dup1.Col2
AND D1.PK > Dup1.PK );

 

3.select distant into,这种方法借助一个新的table,把不重复的结果集转移到新table中.

 

SELECT distinct Col1, Col2 INTO NoDups
FROM Dup1;

select * from NoDups

 

 

 

 建议采用第一种和第三种方法,第一种多见于T-SQL的编程中,第三种在ETL中常常使用.

 

 

转载于:https://www.cnblogs.com/changbluesky/archive/2010/06/07/1700441.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值