sql的over函数的使用

本文详细介绍了SQL中的窗口函数,包括over()的基本语法,以及partitionby和orderby的使用,重点讲解了ROW_NUMBER(),RANK(),DENSE_RANK()和NTILE()的功能区别和应用场景,帮助读者理解如何在数据库查询中进行分组、排序和排名。

开窗函数over:是对一组值进行操作。

over语法有:

1、partition by对子句进行分组

2、order by对子句进行排序
例:
1、对partition by后面的列进行分组,分组后求sum函数中列的和
select sum(列) over (partition by 组)
2、对partition by后面的列分组,然后按order by后面的列排序,最后进行对列1进行累加
select sum(列1) over(partition by 列2 order by 列3)
3、对order by后面的列排序,然后对列1进行累加
select sum(列1)over(order by 列2)
4、对列1进行汇总
select sum(列1)over ()

row_number()函数:ROW_NUMBER()函数作用就是将SELECT查询到的数据进行排序,每一条数据加一个序号,他不能用做于学生成绩的排名,一般多用于分页查询,比如查询前10个 查询10-100个学生。ROW_NUMBER()必须与ORDER BY一起使用,否则会报错。
例:对学生成绩排序
1、班内排序:select row_number()over(partition by 班名列 order by 分数列  desc) from 表 where 条件
2、总排序:select row_number() over(order by 分数列 desc)from 表 where 条件

rank()函数:RANK()函数,顾名思义排名函数,可以对某一个字段进行排名,这里和ROW_NUMBER()有什么不一样呢?ROW_NUMBER()是排序,当存在相同成绩的学生时,ROW_NUMBER()会依次进行排序,他们序号不相同,而Rank()则不一样。如果出现相同的,他们的排名是一样的
例:
使用row_number排序: select row_number()over (order by 分数列 desc)from 表
使用rank()排序:select rank()over (order by 分数列 desc)from 表 


dense_rank()函数:DENSE_RANK()函数也是排名函数,和RANK()功能相似,也是对字段进行排名,那它和RANK()到底有什么不同那?特别是对于有成绩相同的情况,DENSE_RANK()排名是连续的,RANK()是跳跃的排名,一般情况下用的排名函数就是RANK() 
例:
使用rank():select rank()over(order by 分数列 desc)from 表
使用dense_rank():select dense_rank() over(order by 分数列 desc)from 表


ntile()函数:NTILE()函数是将有序分区中的行分发到指定数目的组中,各个组有编号,编号从1开始,就像我们说的'分区'一样 ,分为几个区,一个区会有多少个
例:
把所有数据分为一个区:select ntile(2) over(order by 分数列 desc)from 表
把所有数据分为两个区:select ntile(2) over(order by 分数列 desc)from 表
把所有数据分为三个区:select ntile(3) over(order by 分数列 desc)from 表

SQL窗口函数OVER是数据分析计算中常用的函数,特别是在需要对数据进行分组排序的场景中,下面详细介绍其使用方法、示例和原理。 ### 使用方法 OVER开窗函数必须与聚合函数或排序函数一起使用。聚合函数常见的有SUM()、MAX()、MIN()、COUNT()、AVG()等;排序函数有RANK()、ROW_NUMBER()、DENSE_RANK()、NTILE()等。此外,还有很多函数会和OVER一起使用,如LEAD函数、LAG函数、STRING_AGG函数等[^1][^2]。 OVER()子句是定义窗口的关键,它指定了以下内容: - PARTITION BY:将数据分成多个组(分区),窗口函数在每个分区内独立计算。 - ORDER BY:定义分区内行的排序顺序,这对排名、累积和等函数至关重要。 - ROWS/RANGE BETWEEN:定义窗口帧(window frame),即相对于当前行,计算包含哪些行(如前N行、后N行、所有行到当前行等)。默认为RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW [^3]。 ### 示例 假设存在一个`sales`表,记录了不同`product_id`的销售信息,包含`product_id`、`sale_date`和`sale_amount`三列。 ```sql -- 计算每个产品的累计销售金额 SELECT product_id, sale_date, sale_amount, SUM(sale_amount) OVER (PARTITION BY product_id ORDER BY sale_date) AS cumulative_sales FROM sales; ``` 在这个示例中,使用了`SUM`聚合函数和`OVER`子句。`PARTITION BY product_id`将数据按产品ID进行分组,`ORDER BY sale_date`对每个产品内的数据按销售日期进行排序,`SUM(sale_amount) OVER (...)`计算每个产品的累计销售金额。 ### 原理 OVER函数的核心是创建一个“窗口”,即一组行的集合。这个窗口是基于查询结果集,通过`PARTITION BY`、`ORDER BY`和`ROWS/RANGE BETWEEN`来定义的。聚合函数或排序函数会在这个窗口内进行计算,而不是像普通的聚合函数那样对整个结果集进行计算。这样可以在不进行分组的情况下,为每一行数据计算聚合值或排名等信息。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值