【SQL】累计统计方法,使用SQL详细写出

SQL中累计统计方法及替代方案
该文章已生成可运行项目,

一、累计统计方法

累计统计通常指的是在一组数据中,计算每个数据点的累积总和或者累积其他统计量。在SQL中,这通常可以通过使用窗口函数(如 SUM() OVER())来实现。以下是一些常见的累计统计方法的例子:

累计求和

假设你有一个销售数据表 sales,包含 date(日期)和 amount(销售额)两个字段,你想要计算到当前日期为止的累计销售额:

SELECT
  date,
  amount,
  SUM(amount) OVER (ORDER BY date) AS cumulative_total
FROM
  sales;

这里,SUM(amount) OVER (ORDER BY date) 表示对 amount 进行累计求和,ORDER BY date 表示按照 date 的顺序进行累计。

累计计数

如果你想要计算到当前日期为止的累计销售次数,可以使用 COUNT() 窗口函数:

SELECT
  date,
  COUNT(*) OVER (ORDER BY date) AS cumulative_count
FROM
  sales;

累计平均值

计算到当前日期为止的累计平均销售额:

SELECT
  date,
  amount,
  AVG(amount) OVER (ORDER BY date) AS cumulative_average
FROM
  sales;

累计最大值

计算到当前日期为止的累计最大销售额:

SELECT
  date,
  amount,
  MAX(amount) OVER (ORDER BY date) AS cumulative_max
FROM
  sales;

累计最小值

计算到当前日期为止的累计最小销售额:

SELECT
  date,
  amount,
  MIN(amount) OVER (ORDER BY date) AS cumulative_min
FROM
  sales;

带分区的累计统计

如果你的数据需要按照某个字段进行分区,并在每个分区内部进行累计统计,可以使用 PARTITION BY 子句。例如,按照 year 分区,计算每个年份的累计销售额:

SELECT
  year,
  month,
  amount,
  SUM(amount) OVER (PARTITION BY year ORDER BY month) AS cumulative_total
FROM
  sales
ORDER BY
  year,
  month;

在这个例子中,PARTITION BY year 表示将数据按照 year 字段进行分区,然后在每个分区内部按照 month 进行累计求和。

注意事项

  • 窗口函数的 OVER 子句定义了窗口的排序和分区,而窗口函数本身则定义了要计算的统计量。
  • 累计统计通常依赖于数据的排序,因此选择合适的排序字段非常重要。
  • 在使用窗口函数时,确保你的数据库支持这些功能(大多数现代数据库如 PostgreSQL, MySQL 8.0+, SQL Server, Oracle 等都支持窗口函数)。

这些是使用SQL进行累计统计的一些基本方法。根据你的具体需求,可能需要调整查询以适应不同的数据结构和统计目标。

二、在SQL中,除了窗口函数,还有哪些方法可以实现累计统计?在SQL中,除了使用窗口函数实现累计统计外,还有其他几种方法可以实现类似的效果,尤其是在不支持窗口函数的数据库版本中。以下是一些常见的替代方法:

1. 自连接查询

可以通过将表自身连接到不同的别名上来模拟窗口函数的效果。

累计求和:
SELECT
  a.date,
  a.amount,
  (SELECT SUM(b.amount) FROM sales b WHERE b.date <= a.date) AS cumulative_total
FROM
  sales a
ORDER BY
  a.date;

在这个查询中,我们对sales表进行了自连接,通过子查询在每个记录上计算当前日期及之前所有记录的amount总和。

2. 用户变量

在一些数据库(如MySQL)中,可以使用用户变量来实现累计计算。

累计求和:
SET @cumulative_total := 0;

SELECT
  date,
  amount,
  (@cumulative_total := @cumulative_total + amount) AS cumulative_total
FROM
  sales
ORDER BY
  date;

这里,@cumulative_total变量用于存储累计总和,每行的计算都会更新这个变量。

3. 临时表或表变量

使用临时表或表变量来存储中间的累计结果。

创建临时表:
CREATE TEMPORARY TABLE IF NOT EXISTS temp_sales AS
SELECT
  date,
  amount,
  (SELECT SUM(amount) FROM sales s WHERE s.date <= t.date) AS cumulative_total
FROM
  sales t
ORDER BY
  date;

SELECT * FROM temp_sales;
使用表变量(以MySQL为例):
CREATE TABLE temp_sales (
  date DATE,
  amount DECIMAL,
  cumulative_total DECIMAL
);

INSERT INTO temp_sales (date, amount, cumulative_total)
SELECT
  s1.date,
  s1.amount,
  (SELECT SUM(s2.amount) FROM sales s2 WHERE s2.date <= s1.date) AS cumulative_total
FROM
  sales s1
ORDER BY
  s1.date;

SELECT * FROM temp_sales;

4. 递归CTE(公共表表达式)

在支持CTE的数据库中,可以使用递归CTE来实现累计统计。

累计求和:
WITH RECURSIVE cumulative_sales AS (
  SELECT
    date,
    amount,
    SUM(amount) OVER (ORDER BY date) AS cumulative_total
  FROM
    sales
  WHERE
    date = (SELECT MIN(date) FROM sales)
  UNION ALL
  SELECT
    s.date,
    s.amount,
    cs.cumulative_total + s.amount AS cumulative_total
  FROM
    sales s
  INNER JOIN cumulative_sales cs ON s.date > cs.date
)
SELECT * FROM cumulative_sales;

5. 程序逻辑

在某些情况下,如果SQL查询的性能不佳,可以考虑将数据导出到程序中(如Python、Java等),然后使用程序逻辑来计算累计统计。

注意事项

  • 使用用户变量和自连接方法可能在性能上不如窗口函数。
  • 用户变量的方法依赖于特定的数据库系统,不同的数据库系统可能有不同的实现方式。
  • 使用临时表或表变量可能会增加数据库的存储和IO负担,尤其是在处理大量数据时。
  • 递归CTE可能在大型数据集上性能不佳,且语法相对复杂。

选择哪种方法取决于你的具体需求、数据库的支持情况以及对性能的考虑。

本文章已经生成可运行项目
## 报表制作简述 从提供的文件内容来看,这是一份医院门诊日报表,记录了各科室在2025年7月1日当天的一些关键统计数据。为了将这些数据制成报表,可以采取以下步骤: 1. **创建数据库表格**:首先需要在数据库中创建一张表来存储这份日报的数据。这张表应包括`科室`、`入院人数`、`押金`、`补交`、`小计`、`当月累计`、`出院人数`、`退费`、`统筹基金`、`个人账户`等字段。 2. **插入数据**:根据文件中的数据,编写SQL插入语句,将数据行逐一插入到新创建的表中。 3. **查询统计**:最后通过SQL查询语句实现对报表中各类数据的统计汇总。 ## SQL语句实现 ### 创建表格 ```sql CREATE TABLE outpatient_daily_report ( department VARCHAR(20), -- 科室 admission_num INT, -- 入院人数 deposit DECIMAL(10, 2), -- 押金 additional_payment DECIMAL(10, 2), -- 补交 subtotal DECIMAL(10, 2), -- 小计 monthly_cumulative DECIMAL(10, 2), -- 当月累计 discharge_num INT, -- 出院人数 refund DECIMAL(10, 2), -- 退费 pooled_fund DECIMAL(10, 2), -- 统筹基金 personal_account DECIMAL(10, 2) -- 个人账户 ); ``` ### 插入数据 以“内二科”的数据为例: ```sql INSERT INTO outpatient_daily_report (department, admission_num, deposit, additional_payment, subtotal, monthly_cumulative, pooled_fund, personal_account) VALUES ('内二科', 3, 2000, 0, 2000, 2000, 0, 0); ``` ### 查询统计 为了得到类似于文件中的汇总信息,可以执行如下查询语句: ```sql SELECT SUM(admission_num) AS total_admissions, SUM(deposit + additional_payment) AS total_deposits, SUM(subtotal) AS total_subtotals, SUM(monthly_cumulative) AS total_monthly_cumulative, SUM(discharge_num) AS total_discharges, SUM(pooled_fund) AS total_pooled_fund, SUM(personal_account) AS total_personal_account FROM outpatient_daily_report; ``` ## 知识点 - **SQL基础语法**:涵盖创建表、插入数据及基本聚合函数(如`SUM()`)的使用方法,用于处理和分析数据。 - **数据库设计原则**:了解如何合理设计数据库表结构以适应特定业务需求,确保数据的有效存储和高效检索。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值