PostgreSQL的row_number() over() 用法

语法

row_number() over( [partition by col1] order by col2[desc]) 
  1. row_number() 为返回的记录定义各行编号
  2. pritition by 分组
  3. order by 排序

我们都知道distinct 可以去重,但我今天重点讲使用row_number()函数去重

测试:

我们的目的是删除gg表中重复的数据(重复的数据保留一条原有数据,多余数据删除)

首先我们按照name和href分组,按ctid排序(ctid: 表示数据记录的物理行当信息,指的是 一条记录位于哪个数据块的哪个位移上面。 跟oracle中伪列 rowid 的意义一样的;只是形式不一样。,详情请查看:postgresql之ctid的浅谈 - lottu - 博客园

然后,运行如下 SQL 语句,

select row_number() over(partition by name,href order by ctid) as rn,ctid from gg;

得到的结果如下所示:

rn为该条数据重复的次数;

接下来我们要查询出重复的数据,执行下面语句:

select ctid from (selec

PostgreSQL 中,`row_number()` 函数通常用于窗口函数,它会为每一组数据(分区)分配唯一的行号。如果想实现类似的功能,但不想直接使用 `row_number()`, 可以考虑其他几种替代方法: 1. **递归查询 (Common Table Expression, CTE)**: 通过自连接表并结合 `generate_series()` 或手动计算行数,可以模拟分页或排名。 ```sql WITH recursive ranking AS ( SELECT id, value, ROW_NUMBER() OVER (PARTITION BY group_column ORDER BY some_sort_key) as rank, COUNT(*) OVER (PARTITION BY group_column) as total_rows FROM your_table WHERE group_column = 'your_value' ) SELECT * FROM ranking WHERE rank <= some_limit; ``` 2. **CASE表达式**: 如果只需要获取特定位置的行,可以用 CASE 根据条件排序来实现。 ```sql SELECT id, value, LAG(value, rank - 1) OVER (PARTITION BY group_column ORDER BY value DESC) as rank FROM ( SELECT id, value, RANK() OVER (PARTITION BY group_column ORDER BY value DESC) as rank FROM your_table ) ranked_table WHERE rank <= some_limit; ``` 3. **存储过程**: 创建存储过程,动态地根据需要设置范围或索引。 ```sql CREATE OR REPLACE FUNCTION get_ranked_records(limit INT) RETURNS SETOF your_table_type AS $$ BEGIN RETURN QUERY WITH ranked AS ( SELECT ..., ROW_NUMBER() OVER (PARTITION BY group_column ORDER BY column_to_sort) as rn FROM your_table ) SELECT * FROM ranked WHERE rn <= limit; END; $$ LANGUAGE plpgsql; -- 调用时传递需要的行数 SELECT * FROM get_ranked_records(5); ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值