Mysql窗口函数之组内逐行连续SUM、AVG操作

本文详细介绍了一种使用SQL进行分数累加查询的方法,通过PARTITION BY和ORDER BY结合窗口函数SUM实现按学科分组并逐行连续累加分数的功能。展示了如何根据不同排序规则(升序或降序)获取不同结果,对于理解SQL窗口函数的应用场景非常有帮助。
-- 测试数据 参考 https://www.cnblogs.com/thxj/p/12727589.html
CREATE TABLE `school_score` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` char(1) DEFAULT NULL,
    `course` char(10) DEFAULT NULL,
  `score`  int (2) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ;
CREATE TABLE `school_score` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` char(1) DEFAULT NULL,
    `course` char(10) DEFAULT NULL,
  `score`  int (2) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ;

INSERT INTO `school_score` VALUES (1, 'A','Chinese',80),(2, 'B','Chinese',90),
(3, 'C','Chinese',70),(4, 'A','Math',70),(5, 'B','Math',100),(6, 'C','Math',80),
(7, 'A','English',90),(8, 'B','English',85),(9, 'C','English',99);
-- 按学科分组并且逐行连续累加分数
SELECT
    `name`,
    `course`,
    `score`,
    SUM(score) over (PARTITION BY `course` ORDER BY score DESC ) AS course_score_total
FROM
`school_score`;
-- 执行结果
name    course    score  course_score_total  
------  -------  ------  --------------------
B       Chinese      90                    90
A       Chinese      80                   170
C       Chinese      70                   240
C       English      99                    99
A       English      90                   189
B       English      85                   274
B       Math        100                   100
C       Math         80                   180
A       Math         70                   250

注意:这里的ORDER BY score很关键,如果没有加ORDER BY结果就是组内SUM,显然这并不是我们想要的,并且ORDER BY的规则不一样每行聚合的结果可能会不一样,但最终组内聚合的结果一样
例如:

SELECT
    `name`,
    `course`,
    `score`,
    SUM(score) over (PARTITION BY `course` ORDER BY score ASC/*这里升序*/) AS course_score_total
FROM
`school_score`;
-- 执行结果,注意和上面的不同
name    course    score  course_score_total  
------  -------  ------  --------------------
C       Chinese      70                    70
A       Chinese      80                   150
B       Chinese      90                   240
B       English      85                    85
A       English      90                   175
C       English      99                   274
A       Math         70                    70
C       Math         80                   150
B       Math        100                   250
### 什么是窗口函数窗口函数(Window Function)是一种在 SQL 中用于对数据集进行复杂分析的函数,与传统的聚合函数(如 `SUM`、`AVG`、`COUNT`)不同,窗口函数不会将多行数据合并为一行,而是为每一行返回一个计算结果,同时可以基于一相关的行(称为“窗口”)进行计算 [^1]。 窗口函数通常与 `OVER()` 子句一起使用,允许在不改变原始查询行数的前提下,对数据进行聚合、排序或分析。这种特性使得窗口函数在生成报表、排名分析、趋势分析等场景中非常有用 [^2]。 窗口函数的基本语法如下: ```sql window_function([expression]) OVER ( [PARTITION BY partition_expression] [ORDER BY sort_expression [ASC | DESC]] [frame_clause] ) ``` - **window_function**:窗口函数名称,如 `ROW_NUMBER`, `RANK`, `DENSE_RANK`, `SUM`, `AVG`, `LAG`, `LEAD` 等。 - **PARTITION BY**:将数据划分为多个“分区”,每个分区独立计算。 - **ORDER BY**:定义窗口内的行排序方式。 - **frame_clause**:定义窗口的范围,如 `ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW`。 ### 窗口函数的作用 窗口函数的主要作用是对数据进行分和排序后,对每一数据进行逐行计算。与传统的 `GROUP BY` 聚合不同,窗口函数可以在不丢失原始行信息的前提下进行聚合操作 [^2]。 窗口函数可以解决以下几类问题: - **排名分析**:如 `ROW_NUMBER`, `RANK`, `DENSE_RANK` 可用于对数据进行排名。 - **累计统计**:如 `SUM`, `AVG` 可用于计算累计总和或移动平均。 - **时间序分析**:如 `LAG`, `LEAD` 可用于获取前后行的数据。 - **趋势分析**:如 `FIRST_VALUE`, `LAST_VALUE` 可用于获取窗口内的首尾值。 ### 示例:窗口函数的使用 以下是一个使用窗口函数进行排名分析的 SQL 示例: ```sql SELECT name, department, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS row_num, RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank, DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dense_rank FROM employees; ``` 此查询为每个部门的员工按薪资从高到低分配行号、排名和密集排名 [^3]。 ### 窗口函数的分类 窗口函数可以分为以下几类: - **排名类函数**: - `ROW_NUMBER()`:为每一行分配一个唯一的行号。 - `RANK()`:为每一行分配一个排名,如果有并则后续排名跳过。 - `DENSE_RANK()`:与 `RANK()` 类似,但排名不会跳过。 - **聚合类函数**: - `SUM()`, `AVG()`, `MIN()`, `MAX()`:在窗口范围内进行聚合计算。 - **偏移类函数**: - `LAG(column, offset, default)`:获取当前行之前某行的值。 - `LEAD(column, offset, default)`:获取当前行之后某行的值。 ### 使用窗口函数的优势 - **保留原始行数**:与 `GROUP BY` 不同,窗口函数不会合并行,保留了原始数据结构。 - **灵活的窗口定义**:可以通过 `PARTITION BY` 和 `ORDER BY` 灵活定义窗口范围。 - **高效的数据分析**:适用于复杂的报表和分析场景,如累计统计、排名、趋势分析等 。 ### 注意事项 - 窗口函数的性能依赖于数据量和分区方式,应合理使用 `PARTITION BY` 和 `ORDER BY`。 - 不同数据库系统(如 PostgreSQL、MySQL、SQL Server)对窗口函数的支持略有差异,需注意兼容性。 - 窗口函数通常用于 `SELECT` 子句或 `ORDER BY` 中,不能直接用于 `WHERE` 或 `HAVING` 子句。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值