去除重复行只保留一行,其实是一个会经常遇到的问题。
之前的方法是利用group by 来进行分组的方法来过滤,但自从SQL 2005开始软件加入了一个新的函数 ROW_NUMBER, 在消除重复行的时候就可以利用此函数。
ROW_NUMBER ( ) OVER ( [ PARTITION BY value_expression , ... [ n ] ] order_by_clause )
注: 关于ROW_NUMBER函数的更详细介绍,可以移步到 http://msdn.microsoft.com/zh-cn/library/ms186734.aspx
下面通常一个例子来说明如何得用ROW_NUMBER函数消除重复行。
1. 假如我们有一个员工表
create table employee (id varchar(50), name varchar (500))
2. 向员工表中插入一些数据,当然这里边有一些重复数据。
insert into employee (id, name) values('001', 'Jack Chan') insert into employee (id, name) values('002', 'Paul Zeng') insert into employee (id, name) values('003', 'Tony Hu') insert into employee (id, name) values('004', 'Jim Yang') insert into employee (id, name) values('004', 'Jim Yang') insert into employee (id, name) values('005', 'Ryan Zheng') insert into employee (id, name) values('005', 'Ryan Zheng')
3. 这个时候如果查询所有员工信息,你会得到一些重复数据,
id name 001 Jack Chan 002 Paul Zeng 003 Tony Hu 004 Jim Yang 004 Jim Yang 005 Ryan Zheng 005 Ryan Zheng
4. ROW_NUMBER出场了,重复行瞬间消失。
select id, name from (select id, name, row_number() over(partition by id order by id) rowid from employee) a where rowid = 1
id name 001 Jack Chan 002 Paul Zeng 003 Tony Hu 004 Jim Yang 005 Ryan Zheng
当然,这只是一个小例子,但已经足够展现row_number在消除重复记录方面的强大功能了,代码相对简单容易理解。
本文介绍了一种使用SQL的ROW_NUMBER函数有效去除数据库中重复记录的方法,通过具体实例展示了如何仅保留所需的一行数据,适用于SQL Server 2005及更高版本。
1392

被折叠的 条评论
为什么被折叠?



