数据库结构的脚本:
if exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[TempA]') and OBJECTPROPERTY(id, N'IsUserTable') = 1)
drop table [dbo].[TempA]
GO
CREATE TABLE [dbo].[TempA] (
[id] [int] IDENTITY (1, 1) NOT NULL ,
[PositionName] [varchar] (256) COLLATE Chinese_PRC_CI_AS NULL ,
[EnglishPositionName] [varchar] (256) COLLATE Chinese_PRC_CI_AS NULL
) ON [PRIMARY]
GO
ALTER TABLE [dbo].[TempA] ADD
CONSTRAINT [PK_TempA] PRIMARY KEY CLUSTERED
(
[id]
) ON [PRIMARY]
GO
TempA表中有三个字段,id唯一且为主键,自动增长; PositionName,EnglishPositionName中有重复的记录,比如:
id PositionName EnglishPositionName
20 其他 Others
21 质量工程师 QC Engineer
22 其他 Others
.......
100 质量工程师 QC Engineer
需要剔除重复的"其他","质量工程师"等记录。
采用的SQL语句:
Delete from TempA where id not in (
select max(t1.id) from TempA t1 group by
t1.PositionName,t1.EnglishPositionName)
说明:
(1)需要剔除那几个用于判断重复的字段,则将它们放在group by语句之后。
(2)max(t1.id) 也可以改成:min(t1.id)
比如表T:
id name
1 aa
2 bb
3 cc
4 aa
5 aa
6 cc
如何变成(保留最大的id或者最小的id):
id name
1 aa
2 bb
3 cc
1.使用distinct关键字,导出无重复的数据到一个临时表,删除原表,再从临时表导入数据:
select distinct name into #temp from T
drop table T
select identity(int,1,1) as id, * into T from #temp
drop table #temp
如果原表的id和其他表没有联系并只有id,name列时,用这种方法可以,当然最好原表数据不要太多。
2.不用distinct关键字,导出无重复的数据到一个临时表,删除原表,再从临时表导入数据:
select name into #temp from T where id in (select max(id) from aa group by name)
drop table T
select identity(int,1,1) as id, * into T from #temp
drop table #temp
3.使用delete语句,把name相同的类中id最大(或者最小)的数据删掉,循环执行,直到受影响的行数是0:
delete from T where id in (select max(id) from T group by name having count(*)>1)
4.还是delete语句,把除了name相同的类中最大的id(或者最小)的数据删掉,执行一次即可:
delete from T where id not in (select max(id) from T group by name )