over(partition by ... order by ...) 函数

本文详细介绍了如何使用SQL语句清除数据库中的重复数据,通过实例展示了使用row_number()函数结合子查询来筛选并删除重复记录的方法。此外,还深入解析了rank()和dense_rank()函数在数据排名中的应用,包括它们在处理相同成绩时的不同表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、场景描述: 项目中的定时任务用于清除重复数据
delete from t_b_count t where t.id in (
		select id from (
			select t1.*,row_number() 
			over(partition by t1.order_code,t1.add,t1.delete,t1.update order by 1) rn
			from t_b_count t1 
			where substr(t1.ftp_date,1,6)=to_char(sysdate-1,'yyyyMM') 
		)t2 where t2.rn > 1 
)
二、注意上面 rn 代表按全字段分区后,相同类型数据出现的次数,因为采用的是全字段分区,所以t2.rn>1的数据必定是重复数据,需要删除
三、其它函数说明

按课程分类,分别查出学生的分数排名

select t.name,t.class,t.sroce,rank() 
over(partition by t.class order by t.sroce desc) mm 
from T2_TEMP t;

结果如下:

name      课程		分数	  mm(即出现次数)
dss        1        95        1
ffd        1        95        1
fda        1        80        3
gds        2        92        1
cfe        2        74        2
gf         3        99        1
ddd        3        99        1
3dd        3        78        3
asdf       3        55        4
adf        3        45        5
  1. row_number(): 当有人成绩相同时,只会取第一个
  2. rank(): 跳跃显示,会显示并列的全部数据,但是排名会跳跃,例如:1-1-3
  3. dense_rank(): 同上,但是排名是连续的,不会跳跃。例如:1-1-2
### SQL 中 OVERPARTITION BYORDER BY 的用法与示例 在 SQL 中,`OVER` 子句结合窗口函数(如 `SUM()`、`ROW_NUMBER()` 等)使用时,可以实现复杂的分组和排序操作。以下是 `OVER`、`PARTITION BY` 和 `ORDER BY` 的具体用法及示例。 #### 1. 基本概念 - **OVER**:用于定义窗口函数的操作范围。 - **PARTITION BY**:将数据划分为多个分区,类似于 `GROUP BY`,但不会减少结果集的行数[^1]。 - **ORDER BY**:在每个分区内对数据进行排序[^5]。 #### 2. 示例代码 以下是一些常见的用法示例: ##### 示例 1: 使用 SUM() 进行累计求和 ```sql SELECT column1, column2, column3, SUM(column3) OVER (PARTITION BY column1 ORDER BY column2) AS cumulative_sum FROM your_table; ``` 此查询会根据 `column1` 分区,并按照 `column2` 排序,计算 `column3` 的累计和[^2]。 ##### 示例 2: 使用 ROW_NUMBER() 进行分组排序 ```sql SELECT id, name, age, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank FROM employees; ``` 此查询会根据 `department` 分区,并按照 `salary` 降序排序,为每个分区中的行分配一个唯一的行号[^3]。 ##### 示例 3: 获取每个分组中的最新记录 ```sql WITH RankedRecords AS ( SELECT FldID, ID, Words, Rev, ROW_NUMBER() OVER (PARTITION BY ID ORDER BY Rev DESC) AS NewRev FROM WorkItemLongTexts WHERE FldID = 52 ) SELECT FldID, ID, Words, Rev FROM RankedRecords WHERE NewRev = 1; ``` 此查询通过 `ROW_NUMBER()` 函数为每个 `ID` 分区内的记录按 `Rev` 值降序排序,并选取最新的记录[^4]。 ##### 示例 4: 使用 MAX() 计算分区最大值 ```sql SELECT column1, column2, column3, MAX(column3) OVER (PARTITION BY column1) AS max_value FROM your_table; ``` 此查询会根据 `column1` 分区,计算每个分区内 `column3` 的最大值。 #### 3. 注意事项 - 如果未指定 `ORDER BY`,窗口函数将在整个分区内进行全局计算。 - 窗口函数不会减少结果集的行数,而聚合函数(如 `GROUP BY`)会减少行数。 - 窗口函数必须紧跟在列名或表达式后,不能单独出现在 `SELECT` 列表中。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值