SQL的开窗函数

引用

在开窗函数出现之前存在着非常多用 SQL 语句非常难解决的问题,非常多都要通过复杂的相关子查询或者存储过程来完毕。为了解决这些问题,在2003年ISO SQL标准增加了开窗函数,开窗函数的使用使得这些经典的难题能够被轻松的解决。眼下在 MSSQLServer、Oracle、DB2 等主流数据库中都提供了对开窗函数的支持,只是非常遗憾的是 MYSQL 临时还未对开窗函数给予支持。

开窗函数说明

开窗函数与聚合函数一样,也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值开窗函数可以为每组返回多个值,因为开窗函数所执行聚合计算的行集组是窗口。

语法

主要是over( PARTITION BY (根据某条件分组,形成一个小组)….ORDER BY(再组内进行排序) …. ) 

常用函数

(最常用的应该是1.2.3 的排序) 

1、row_number() over(partition by … order by …) 

增加一列,类似与增加伪列 

2、rank() over(partition by … order by …) 

3、dense_rank() over(partition by … order by …) 

rank(): 跳跃排序,如果有两个第一级时,接下来就是第三级。 
dense_rank(): 连续排序,如果有两个第一级时,接下来仍然是第二级。 

4、count() over(partition by … order by …) 

5、max() over(partition by … order by …) 

6、min() over(partition by … order by …) 

7、sum() over(partition by … order by …) 

8、avg() over(partition by … order by …) 

9、first_value() over(partition by … order by …) 

10、last_value() over(partition by … order by …) 

与函数的功能一致,只是是开窗函数 :有一个小坑 last_value()默认统计范围是 rows between unbounded preceding and current row

https://blog.youkuaiyun.com/hzp666/article/details/110442268

11、lag() over(partition by … order by …) 

12、lead() over(partition by … order by …) 

lag 和lead 可以 获取结果集中,按一定排序所排列的当前行的上下相邻若干offset 的某个行的某个列(不用结果集的自关联); 
lag ,lead 分别是向前,向后; 
lag 和lead 有三个参数,第一个参数是列名,第二个参数是偏移的offset,第三个参数是 超出记录窗口时的默认值)

MySQL为什么不支持

### 使用 SQL 开窗函数进行数据分析 #### 定义与基本语法 开窗函数允许在查询中执行聚合计算而不减少行数。其调用格式如下: ```sql 函数名(列名) OVER(PARTITION BY 列名 ORDER BY 列名) ``` 此结构使得可以在同一查询结果集中应用复杂的分析操作,而无需依赖子查询或连接[^1]。 #### 实际应用场景中的使用方法 为了更好地理解如何利用这些强大的工具来增强数据探索能力,在实际编写SQL语句时通常会采用这样的模式: ```sql SELECT 要获取的数据, <窗口函数> OVER (PARTITION BY 用于分组的列名 AS `别名` ORDER BY 用于排序的列名) FROM 表; ``` 这里的关键在于正确指定`OVER()`子句内的参数——即哪些字段应该被用来分区以及按什么顺序排列记录[^2]。 #### 常见例子说明 考虑一个销售数据库表`sales`,其中包含销售人员的名字(`name`)、销售额度(`amount`)和日期(`date`)三个主要属性。如果想要知道每个月每位员工相对于团队平均业绩的表现情况,则可以这样写: ```sql WITH monthly_sales AS ( SELECT name, DATE_FORMAT(date,'%Y-%m') as month, SUM(amount) as total_amount FROM sales GROUP BY name,month ), avg_monthly_performance AS( SELECT AVG(total_amount) OVER() avg_total ,total_amount,name,month FROM monthly_sales ) SELECT *, CASE WHEN total_amount > avg_total THEN 'Above Average' ELSE 'Below Average' END performance_status FROM avg_monthly_performance ; ``` 上述脚本首先创建了一个临时视图monthly_sales,它汇总了每个人每月总的销售收入;接着定义另一个CTE(avg_monthly_performance),在这里运用了AVG作为窗口函数并跨越整个结果集求得整体均值;最后一步则是基于这个新构建的结果集合判断个人表现是否优于平均水平[^3]. #### 高级特性介绍 除了标准的`PARTITION BY` 和 `ORDER BY`, 还有其他一些高级选项可用于更精细地控制窗口行为,比如可以通过设置框架边界来自定义要处理的具体范围。然而对于初学者来说掌握基础形式已经足够应对大多数日常需求了[^4].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值