语法
row_number() over( [partition by col1] order by col2[desc])
- row_number() 为返回的记录定义各行编号
- pritition by 分组
- order by 排序
我们都知道distinct 可以去重,但我今天重点讲使用row_number()函数去重
测试:
我们的目的是删除gg表中重复的数据(重复的数据保留一条原有数据,多余数据删除)
首先我们按照name和href分组,按ctid排序(ctid: 表示数据记录的物理行当信息,指的是 一条记录位于哪个数据块的哪个位移上面。 跟oracle中伪列 rowid 的意义一样的;只是形式不一样。,详情请查看:postgresql之ctid的浅谈 - lottu - 博客园)
然后,运行如下 SQL 语句,
select row_number() over(partition by name,href order by ctid) as rn,ctid from gg;
得到的结果如下所示: