利用 row_number 函数来消除表中的重复行

最新推荐文章于 2024-01-18 17:39:45 发布

转载最新推荐文章于 2024-01-18 17:39:45 发布 · 711 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/EasonWu/archive/2012/06/06/2538185.html

文章标签：

#数据库 #大数据

本文介绍了一种使用SQL的ROW_NUMBER函数有效去除数据库中重复记录的方法，通过具体实例展示了如何仅保留所需的一行数据，适用于SQL Server 2005及更高版本。

去除重复行只保留一行，其实是一个会经常遇到的问题。

之前的方法是利用group by 来进行分组的方法来过滤，但自从SQL 2005开始软件加入了一个新的函数 ROW_NUMBER, 在消除重复行的时候就可以利用此函数。

ROW_NUMBER ( ) 
    OVER ( [ PARTITION BY value_expression , ... [ n ] ] order_by_clause )

注：关于ROW_NUMBER函数的更详细介绍，可以移步到 http://msdn.microsoft.com/zh-cn/library/ms186734.aspx

下面通常一个例子来说明如何得用ROW_NUMBER函数消除重复行。

1. 假如我们有一个员工表

create table employee (id varchar(50), name varchar (500))

2. 向员工表中插入一些数据，当然这里边有一些重复数据。

insert into employee (id, name) values('001', 'Jack Chan')
insert into employee (id, name) values('002', 'Paul Zeng')
insert into employee (id, name) values('003', 'Tony Hu')
insert into employee (id, name) values('004', 'Jim Yang')
insert into employee (id, name) values('004', 'Jim Yang')
insert into employee (id, name) values('005', 'Ryan Zheng')
insert into employee (id, name) values('005', 'Ryan Zheng')

3. 这个时候如果查询所有员工信息，你会得到一些重复数据，

id    name
001    Jack Chan
002    Paul Zeng
003    Tony Hu
004    Jim Yang
004    Jim Yang
005    Ryan Zheng
005    Ryan Zheng

4. ROW_NUMBER出场了，重复行瞬间消失。

select id, name 
  from (select id, name, 
               row_number() over(partition by id order by id) rowid 
          from employee) a
where rowid = 1

id    name
001    Jack Chan
002    Paul Zeng
003    Tony Hu
004    Jim Yang
005    Ryan Zheng

当然，这只是一个小例子，但已经足够展现row_number在消除重复记录方面的强大功能了，代码相对简单容易理解。

转载于:https://www.cnblogs.com/EasonWu/archive/2012/06/06/2538185.html