postgresql-窗口函数

本文详细介绍了PostgreSQL中的窗口函数,包括其定义、使用OVER子句中的分区、排序和窗口选项,以及举例说明了聚合函数、排名和累计销量的计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

窗口函数简介

包括 AVG、COUNT、MAX、MIN、SUM 以及
STRING_AGG。聚合函数的作用是针对一组数据行进行运算,并且返回一条汇总结果
分析的窗口函数(Window Function)。
不过,窗口函数不是将一组数据汇总为单个结果,而是针对每一行数据,基于和它相关的一组数
据计算出一个结果。下图演示了聚合函数和窗口函数的区别
在这里插入图片描述
区别在于后者包含了 OVER 关键字;空括号表示将所有数据作为整体进行分析,所以得到的数值和聚合函数一样

窗口函数的定义

window_function ( expression, ... ) OVER (
 PARTITION BY ...
 ORDER BY ...
 frame_clause
)

window_function 是窗口函数的名称;expression 是函数参数,有些函数不需要参数;
over 子句包含三个选项:分区(partition by)、排序(order by)以及窗口大小
frame_clause

分区

-- 计算员工的部门平均薪水
-- partition by分组统计,和group by 类似
select 
e.employee_id ,
e.first_name ,
e.last_name ,
e.salary ,
e.department_id ,
round(avg(e.salary) over(partition by e.department_id),2) as avg_sal
from employees e;

在这里插入图片描述
partition by 选项用于定义分区,作用类似于 group by 的分组。如果指定了分区选项,
窗口函数将会分别针对每个分区单独进行分析;如果省略分区选项,所有的数据作为一个整体进
行分析

排序选项

order by 选项用于指定分区内的排序方式,通常用于数据的排名分析

-- 员工在部门内薪水排名
select 
e.employee_id ,
e.first_name ,
e.last_name,
e.salary ,
e.department_id ,
rank() over(partition by e.department_id order by e.salary desc)
from employees e;

在这里插入图片描述

窗口选项

frame_clause 选项用于在当前分区内指定一个计算窗口。指定了窗口之后,分析函数不再基
于分区进行计算,而是基于窗口内的数据进行计算

-- public.sales_monthly definition

-- Drop table

-- DROP TABLE public.sales_monthly;

CREATE TABLE public.sales_monthly (
	product varchar(20) NULL,
	ym varchar(10) NULL,
	amount numeric(10, 2) NULL
);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('苹果','201801',10159.00),
	 ('苹果','201802',10211.00),
	 ('苹果','201803',10247.00),
	 ('苹果','201804',10376.00),
	 ('苹果','201805',10400.00),
	 ('苹果','201806',10565.00),
	 ('苹果','201807',10613.00),
	 ('苹果','201808',10696.00),
	 ('苹果','201809',10751.00),
	 ('苹果','201810',10842.00);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('苹果','201811',10900.00),
	 ('苹果','201812',10972.00),
	 ('苹果','201901',11155.00),
	 ('苹果','201902',11202.00),
	 ('苹果','201903',11260.00),
	 ('苹果','201904',11341.00),
	 ('苹果','201905',11459.00),
	 ('苹果','201906',11560.00),
	 ('香蕉','201801',10138.00),
	 ('香蕉','201802',10194.00);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('香蕉','201803',10328.00),
	 ('香蕉','201804',10322.00),
	 ('香蕉','201805',10481.00),
	 ('香蕉','201806',10502.00),
	 ('香蕉','201807',10589.00),
	 ('香蕉','201808',10681.00),
	 ('香蕉','201809',10798.00),
	 ('香蕉','201810',10829.00),
	 ('香蕉','201811',10913.00),
	 ('香蕉','201812',11056.00);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('香蕉','201901',11161.00),
	 ('香蕉','201902',11173.00),
	 ('香蕉','201903',11288.00),
	 ('香蕉','201904',11408.00),
	 ('香蕉','201905',11469.00),
	 ('香蕉','201906',11528.00),
	 ('桔子','201801',10154.00),
	 ('桔子','201802',10183.00),
	 ('桔子','201803',10245.00),
	 ('桔子','201804',10325.00);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('桔子','201805',10465.00),
	 ('桔子','201806',10505.00),
	 ('桔子','201807',10578.00),
	 ('桔子','201808',10680.00),
	 ('桔子','201809',10788.00),
	 ('桔子','201810',10838.00),
	 ('桔子','201811',10942.00),
	 ('桔子','201812',10988.00),
	 ('桔子','201901',11099.00),
	 ('桔子','201902',11181.00);
INSERT INTO public.sales_monthly (product,ym,amount) VALUES
	 ('桔子','201903',11302.00),
	 ('桔子','201904',11327.00),
	 ('桔子','201905',11423.00),
	 ('桔子','201906',11524.00);

/*
 * 计算每个产品当当前月份的累计销量
*/
select
	m.product ,
	m.ym ,
	m.amount,
	sum(m.amount) over(partition by m.product 
	order by m.ym rows between unbounded  preceding and current row)
from
	sales_monthly m
	order by m.product,m.ym;

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
常见的窗口函数可以分为以下几类:聚合窗口函数、排名窗口函数以及取值窗口函数。
更多的复杂选项可以参考官方文档

<think>我们正在回答用户关于PostgreSQL窗口函数的问题。根据提供的引用资料,我们需要总结窗口函数的基本概念、语法结构,并给出示例教程。注意:用户要求使用中文回答,并且按照给定的格式要求(行内数学公式用$...$,独立公式用$$...$$,生成相关问题等)。步骤:1.介绍窗口函数的概念,强调其与聚合函数的区别(窗口函数不将多行聚合成一行,而是保留原有行)。2.解释窗口函数的语法结构,包括OVER子句、PARTITION BY、ORDERBY以及窗口帧(frame_clause)等。3.给出几个常见的窗口函数示例(如row_number(), rank(), dense_rank(), sum()over()等)并解释。4.提供示例SQL语句和预期结果,帮助用户理解。5.生成相关问题。注意:引用资料中提供了多个来源,我们在回答中适当引用。开始回答:</think>### PostgreSQL 窗口函数使用指南 #### 一、基本概念 窗口函数(Window Function)允许在查询结果集的**指定行子集**(窗口)上执行计算,同时保留所有原始行。与聚合函数不同,窗口函数**不会合并多行结果**,而是为每行返回独立计算结果[^3][^4]。 核心语法结构: ```sql 函数名(表达式) OVER ( [PARTITION BY 分组字段] [ORDER BY 排序字段 [ASC|DESC]] [窗口帧子句] ) ``` #### 二、核心语法详解 1. **`PARTITION BY`** 将数据按指定字段分组,函数在**每个分组内独立计算**。 ```sql -- 按部门分组计算平均薪资 SELECT name, department, salary, AVG(salary) OVER (PARTITION BY department) AS dept_avg_salary FROM employees; ``` 2. **`ORDER BY`** 定义窗口内数据的**计算顺序**,常用于累计计算: ```sql -- 按时间累计销售额 SELECT order_date, amount, SUM(amount) OVER (ORDER BY order_date) AS running_total FROM sales; ``` 3. **窗口帧子句** 指定函数计算的具体范围: - `ROWS BETWEEN N PRECEDING AND M FOLLOWING`:物理行偏移 - `RANGE BETWEEN INTERVAL '7' DAY PRECEDING AND CURRENT ROW`:逻辑值范围 ```sql -- 计算7天移动平均 SELECT date, revenue, AVG(revenue) OVER ( ORDER BY date RANGE BETWEEN INTERVAL '7' DAY PRECEDING AND CURRENT ROW ) AS moving_avg FROM daily_sales; ``` #### 三、常用窗口函数示例 | 函数类型 | 示例函数 | 用途说明 | |----------------|---------------------------|------------------------------| | 排名函数 | `ROW_NUMBER()` | 生成分组内连续序号 | | | `RANK()` | 允许并列排名(跳号) | | | `DENSE_RANK()` | 允许并列排名(不跳号) | | 聚合类窗口函数 | `SUM() OVER()` | 分组累计求和 | | | `AVG() OVER()` | 分组移动平均 | | 分布函数 | `PERCENT_RANK()` | 计算百分比排名 | | 前后行访问 | `LAG(column, n)` | 访问前n行数据 | #### 四、完整示例教程 ```sql -- 示例表:员工薪资数据 CREATE TABLE employees ( id SERIAL PRIMARY KEY, name VARCHAR(50), department VARCHAR(50), salary NUMERIC ); -- 查询:计算部门内薪资排名及与部门平均薪资的差异 SELECT name, department, salary, RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dept_rank, salary - AVG(salary) OVER (PARTITION BY department) AS diff_from_avg FROM employees; ``` **结果示例**: | name | department | salary | dept_rank | diff_from_avg | |-------|------------|--------|-----------|---------------| | Alice | HR | 8000 | 1 | +2000 | | Bob | HR | 6000 | 2 | 0 | | Carol | IT | 9000 | 1 | +1500 | #### 五、关键技巧 1. **多层窗口**:可定义命名窗口复用配置 ```sql SELECT *, SUM(x) OVER w1, AVG(y) OVER w2 FROM table WINDOW w1 AS (PARTITION BY a ORDER BY b), w2 AS (w1 ROWS BETWEEN 2 PRECEDING AND CURRENT ROW); ``` 2. **`FILTER`子句**:仅对符合条件的行计算 ```sql SELECT department, AVG(salary) FILTER (WHERE salary > 5000) OVER () AS high_salary_avg FROM employees; ``` > **注意**:窗口函数在`SELECT`子句执行阶段计算,**不可用于`WHERE`或`GROUP BY`** 子句[^2][^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值