group by 和 over(partition by)的区别

1>建表并插入数据,因为over是开窗函数,mysql不支持开窗函数,其他如oracle,sql server,db2...等新版本都支持(这里借用他人的数据)

CREATE TABLE Employee
(
  ID number(10) not null primary key,
  EmpName varchar(20),
  EmpSalary varchar(10),
  EmpDepartment varchar(20)
);
 
insert all into Employee values(1,'张三','5000','开发部')
into Employee values(2,'李四','2000','销售部')
into Employee values(3,'王麻子','2500','销售部')
into Employee values(4,'张三表叔','8000','开发部')
into Employee values(5,'李四表叔','5000','开发部')
into Employee values(6,'王麻子表叔','5000','销售部')
select 1 from dual

2>计算每个部门的总薪水?

2.1>group by

SELECT EmpDepartment,SUM(EmpSalary) sum_sala FROM Employee GROUP BY EmpDepartment

在这里插入图片描述
2.2>over(partition by)

SELECT EmpSalary,EmpDepartment,SUM(EmpSalary) OVER(PARTITION BY EmpDepartment) sum_sala FROM Employee

在这里插入图片描述

此处小结:group bypartition by 都有分组统计的功能,但是partition by并不具有group by的汇总功能。partition by统计的每一条记录都存在,而group by将所有的记录汇总成一条记录(类似于distinct EmpDepartment 去重)。partition by可以和聚合函数结合使用,同时具有其他高级功能。

3>在partition by 后在加上order by

SELECT EmpSalary,EmpDepartment,SUM(EmpSalary) OVER(PARTITION BY EmpDepartment ORDER BY EmpSalary) sum_sala FROM Employee

在这里插入图片描述

此处小结:加上order by 后,类似于累加功能(sum_sala += EmpSalary),先观察销售部的结果,从第4条记录开始,其sum(EmpSalary)sum_sala=2000,第5条记录,sum(EmpSalary)=sum_sala+2500=4500,即第4条sum_sala与第5条EmpSalary的和,依次类推;开发部,由于2个5000是并列的,所以计算的时候是几个并列数据之和即5000+5000=10000。


开窗函数 over ( partition by)以及和group by 的区别

1.over函数的写法:

overpartition by class order by sroce)

按照sroce排序进行累计,order by是个默认的开窗函数,按照class分区。

2、开窗的窗口范围:

 overorder by sroce range between 5 preceding and 5 following

窗口范围为当前行数据幅度减5加5后的范围内的。

 overorder by sroce rows between 5 preceding and 5 following

窗口范围为当前行前后各移动5行。

 sum() over(partition byorder by):求分组后的总和。 
 first_value() over(partition byorder by):求分组后的第一个。 
 last_value() over(partition byorder by):求分组后的最后一个。 
 count() over(partition byorder by):求分组后的总数。 
 max() over(partition byorder by):求分组后的最大值。 
 min() over(partition byorder by):求分组后的最小值。 
 avg() over(partition byorder by):求分组后的平均值。 
 lag() over(partition byorder by):取出前n行数据。   
 lead() over(partition byorder by):取出后n行数据。

3.over partition bygroup by 的区别

原表:

NAME     DEPT    SALARY
A         10     1000
B         10     2000
C         20     1500
D         20     3000
E         10     1000   

over partition by 我就可以查询到每位员工本来的具体信息和它所在部门的总工资:

select name,dept,salary,sum(salary) over (partition by dept) total_salary from salary;  
name     dept      salary      tatal_salary
A        10        1000        4000
B        10        2000        4000
E        10        1000        4000
C        20        1500        4500
D        20        3000        4500

goup by 就没办法做到这点,只能查询到每个部门的总工资:

select dept,sum(salary) total_salary from salary group by dept
dept      total_salary
10        4000
20        4500

over partition by会把每个数据的明细都显现出来,聚合显示多条
group by 聚合只会显示一条


over partition bygroup by 的区别

group by 只能得到分组后的统计数据,over partition by 不仅可以得到分组后的统计数据,还可以同时显示明细数据。
group by 是在where子句之后;over partition byfrom子句之前。

over partition bygroup by 都是与统计类函数用,这两个有什么区别呢?
目前我只知道一个这样的区别:
比如有一张表saraly:

CREATE TABLE SALARY AS 
SELECT 'A' NAME,10 DEPT,1000 SALARY FROM DUAL 
UNION ALL 
SELECT 'B',10,2000 FROM DUAL 
UNION ALL 
SELECT 'C' ,20,1500 FROM DUAL 
UNION ALL 
SELECT 'D',20,3000 FROM DUAL 
UNION ALL
SELECT 'E',10,1000 FROM DUAL;
NAME DEPT SALARY
A         10     1000
B         10     2000
C         20     1500
D         20     3000
E         10     1000  

over partition by 我就可以查询到每位员工本来的具体信息和它所在部门的总工资:

select name,dept,salary,sum(salary) over (partition by dept) total_salary from salary; 
name       dept         salary      tatal_salary
A        10        1000        4000
B        10        2000        4000
E        10        1000        4000
C        20        1500        4500
D        20        3000        4500

goup by 就没办法做到这点,只能查询到每个部门的总工资:

select dept,sum(salary) total_salary from salary group by dept
dept        total_salary
10        4000
20        4500

另外over partition by 还可以做到查询每位员工占部门总工资的百分比:

select name,dept,salary,salary*100/sum(salary) over (partition by dept) percent from salary;
name       dept         salary     percent
A        10        1000        25
B        10        2000        50
E        10        1000        25
C        20        1500        33.3333333333333
D        20        3000        66.6666666666667

group by 也没办法做到这个.不知道我的理解正不正确,请各位朋友指点,特别是over partition bygroup by 的更多区别请各位一起分享,谢谢!

### SQL 中 `GROUP BY` `PARTITION BY` 的区别 在 SQL 查询中,`GROUP BY` `PARTITION BY` 都具有分组数据的功能,但它们的应用场景、执行顺序以及对数据的影响存在显著差异。 #### 1. 数据聚合保留 `GROUP BY` 是传统的分组操作,它将数据按照指定列分组,并对每组进行聚合计算,最终每组只保留一行结果。它适用于只需要分组统计值的场景,例如统计每个城市的订单总数。 ```sql SELECT Customercity, COUNT(*) AS TotalOrders FROM [dbo].[Orders] GROUP BY Customercity; ``` 该查询中,原始数据被压缩,仅保留每个城市的订单总数,原始的订单记录不再可见 [^3]。 而 `PARTITION BY` 是窗口函数的一部分,它在保留原始数据行的基础上,对每个分组内的数据进行分析计算。例如,计算每个城市的订单平均值,同时保留每条订单记录。 ```sql SELECT Customercity, CustomerName, OrderAmount, AVG(OrderAmount) OVER(PARTITION BY Customercity) AS AvgOrderAmount FROM [dbo].[Orders]; ``` 该查询中,每条订单记录都保留,并新增一列显示该客户所在城市的平均订单金额 [^1]。 #### 2. 执行顺序作用范围 `GROUP BY` 在 SQL 执行流程中较早进行,它作用于 `FROM` `WHERE` 之后,`HAVING` `ORDER BY` 之前。它将原始数据集转换为聚合后的结果集。 ```sql SELECT Customercity, SUM(OrderAmount) AS TotalSales FROM [dbo].[Orders] GROUP BY Customercity; ``` 而 `PARTITION BY` 是在 `SELECT` 阶段执行,作用于已经筛选连接后的结果集。它不会改变原始数据的行数,而是在每一行上执行窗口函数计算 。 #### 3. 分组后的数据处理方式 `GROUP BY` 将分组后的数据压缩为一行,仅保留分组列聚合函数的结果。它具有去重效果,适用于生成汇总报表。 ```sql SELECT Customercity, AVG(OrderAmount) FROM [dbo].[Orders] GROUP BY Customercity; ``` `PARTITION BY` 则不会减少行数,所有原始数据行都会保留,并在每行基础上计算窗口函数的结果。例如,计算每个城市的累计订单金额。 ```sql SELECT Customercity, OrderDate, OrderAmount, SUM(OrderAmount) OVER(PARTITION BY Customercity ORDER BY OrderDate) AS RunningTotal FROM [dbo].[Orders]; ``` 该查询中,每条订单记录都显示,并附加一个累计金额列,用于展示该城市从开始到当前订单日期的总订单金额 [^2]。 #### 4. 理论基础应用场景 从集合论角度看,`GROUP BY` 类似于将原始集合划分为若干子集,然后对每个子集进行聚合操作,最终结果是每个子集对应一条记录。它适用于需要减少数据维度、提取关键指标的场景。 `PARTITION BY` 则更接近于“带上下文的计算”,它在不改变原始集合结构的前提下,对每个子集(分区)进行逐行分析。它适用于需要保留原始数据结构并附加分析值的场景,如排名、累计统计、滑动平均等。 --- ###
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值