使用Pandas的`sum()`函数可以方便地计算DataFrame的单个数据列的总和，或者对所有数据列进行求和

最新推荐文章于 2025-07-22 11:37:38 发布

数据科学智慧

最新推荐文章于 2025-07-22 11:37:38 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

文章标签： pandas Python

本文链接：https://blog.youkuaiyun.com/Meta_C/article/details/132660751

Python 专栏收录该内容

310 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了如何使用Pandas的`sum()`函数对DataFrame的单个列或所有列进行求和操作。通过示例代码详细阐述了函数的用法，包括按列求和、按行求和，帮助理解数据分析中的求和功能。

使用Pandas的sum()函数可以方便地计算DataFrame的单个数据列的总和，或者对所有数据列进行求和。sum()函数可以对数值型数据进行求和操作，并返回一个包含求和结果的Series。

下面我们将详细介绍如何使用sum()函数进行求和操作，并给出相应的源代码示例。

首先，我们需要导入Pandas库：

import pandas as pd

接下来，我们创建一个示例DataFrame：

data = {
   
   'A': [1, 2,

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

数据科学智慧

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

pandas使用sum函数计算dataframe单数据列的加和或者对所有的数据列进行求和（sum column or all columns of dataframe）

data+scenario+science+insight

03-02

1823

pandas使用sum函数计算dataframe单数据列的加和或者对所有的数据列进行求和（sum column or all columns of dataframe）

使用Pandas计算DataFrame数据列或所有数据列的总和

BUG？不存在的！

04-27

1459

使用Pandas计算DataFrame数据列或所有数据列的总和在使用Pandas处理数据时，常常需要对DataFrame中的数据进行求和操作。本文将介绍如何使用Pandas的sum函数，计算DataFrame单数据列的加和或者对所有的数据列进行求和。这个DataFrame有3列，每列都有4行数据。我们可以使用sum函数来计算某一列或所有列的总和。

参与评论您还未登录，请先登录后发表或查看评论

Pandas中汇总统计、处理缺失值、层次化索引超详细介绍！（附实例）

别看我只是一只羊

02-22

8194

阅读提示本文将提到Pandas汇总统计和计算方法、处理缺失值操作、层次化索引等内容目录阅读提示一、pandas汇总统计和计算1、sum()和cumsum()方法2、idxmax() 方法3、unique() 方法4、value_counts() 方法5、isin() 方法二、pandas处理缺失数据1、过滤缺失数据对于Series对于Dataframe2、对缺失值进行填充三、pandas层次化...

dataframe.sum()函数

热门推荐

vuvu_an的博客

12-28

3万+

官方帮助文档解释; DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, **kwargs) axis : {index (0), columns (1)},axis=0代表对列进行求和，axis=1代表对行进行求和。调用DataFrame的sum方法将会返回一个含有列小计的Series：传入axis=1将

Pandas.DataFrame.sum() 求和详解含代码含测试数据集随Pandas版本持续更新

数象限

01-24

4972

本文基于 pandas2.2.0 编写。随着pandas的stable版本更迭，本文持续更新，不断完善补充。

Python DataFrame常用描述性统计分析方法（Pandas篇-15）

侯小啾技术博客

03-07

3988

在 `Pandas` 中，`DataFrame` 提供了许多常用的描述性统计分析方法，可以帮助对数据进行快速的了解和分析。具体如1. `describe()`方法-描述性统计，2. `mean()`方法-求均值 3. `median()`方法-中位数4. `mode()`方法- 求众数5. `min()`&`max()`-最小值与最大值6. `std()`&`var()`标准差与方差7. `sum()`方法-求和8.`count()`方法-非缺失值计数9. `quantile()`方法-分位数...

从0到1学Pandas（三）：Pandas 数据处理进阶

邓邓子的博客

07-22

1120

本文聚焦数据处理进阶技巧。涵盖数据分组与聚合，包括 groupby 分组、常见及自定义聚合函数应用；数据合并与连接，详解 merge、concat 操作及适用场景；数据重塑，涉及透视表、melt 转换和多层索引应用；还有时间序列处理，如创建、索引切片及频率转换。通过实用方法和示例，助力读者提升 Pandas 数据处理能力，高效应对复杂数据分析任务。

pandas入门（5）——汇总和计算描述统计

Annaaphq的博客

08-02

730

汇总和计算统计描述

python sum函数用法_Pandas DataFrame.sum()使用介绍

weixin_39986466的博客

11-24

7419

Pandas DataFrame.sum()函数用于返回用户所请求轴的值之和。如果输入值是索引轴, 则它将在列中添加所有值, 并且对所有列都相同。它返回一个序列, 其中包含每一列中所有值的总和。在计算DataFrame中的总和时, 它还能够跳过DataFrame中的缺失值。句法：DataFrame.sum(axis=None, skipna=None, level=None, numeric_on...

【Pandas】深入解析pandas中的统计汇总函数`sum()`

qq_38614074的博客

06-11

3421

sum()一、引言在数据处理和分析的世界里，求和（sum()）是一个基础且重要的操作。Pandas库作为Python数据分析的利器，提供了功能强大的sum()函数，用于计算DataFrame或Series对象中所有元素或指定轴上的和。本文将深入解析Pandas中的sum()函数，通过源代码和案例来展示其强大功能和应用场景。二、sum()函数的基本用法。

【第5章Pandas实战案例与解析整理数据】5.340 Pandas深度解析：使用sum()在DataFrame中按列求和

03-05

921

在数据分析过程中，对数据进行聚合操作是非常常见的需求。Pandas库提供了多种方法来进行数据的聚合，其中之一是sum()函数。本文将详细介绍如何使用sum()函数在DataFrame中按列求和，并通过多个示例展示其应用。DataFrame是Pandas库中最常用的数据结构之一，用于存储和操作表格数据。它由行和列组成，类似于电子表格或SQL表。每个列可以包含不同类型的值（例如整数、浮点数、字符串等），并且每个列都有一个名称。定义一个复杂的自定义函数，根据特定逻辑对DataFrame中的列进行求和。

pandas 常用的数学统计方法 sum()

weixin_38477351的博客

02-27

7310

pandas 常用的数学统计方法 sum() 1、定义：值的总和。 2、示例： import pandas as pd student_info = pd.read_csv("F:/人工智能/科学计算库/files/student_info.csv") print(student_inf...

Pandas.Series.sum() 求和详解含代码含测试数据集随Pandas版本持续更新

数象限

01-23

2450

本文基于 pandas2.2.0 编写。随着pandas的stable版本更迭，本文持续更新，不断完善补充。

Python中用sum求dataframe某列的数量

雪山飞狐

12-19

6760

sum()是求和函数，如果对象是一些具体数字就是求和；如果对象是bool类型，那么True=1，False=0，从而sum求和可以得知True的数量。例如，一个dataframe结构如下要求education为bachelor的人数： (data[“education”]==“bachelor”).sum() 因为前面圆括号中的内容为一个判断不等式，只有False和True两个类型。或者...

pandas之汇总和计算描述统计

TSzero的博客

04-01

4279

本文介绍pandas中几种常用的汇总和计算描述统计

Pandas对行/列求和

Bianca427的博客

05-29

7923

Pandas对行/列求和

【python】pandas求和某列数据

amber_o0k的博客

07-08

4677

pandas求和某列数据

python pandas实现excel中的sum函数功能

weixin_45144170的博客

07-30

7606

sum函数是excel中经常用到的函数，那么在pandas中也存在这样的函数，下面详细了解一下这个函数： >>> import pandas as pd >>> import numpy as np >>> df=pd.read_excel(r'D:/myExcel/1.xlsx') >>> df A B C D 0 3 1.0 1.1 hello 1 3 NaN 2.2 hello 2

【Pandas必看】DataFrame 数据神操作！轻松实现数据分组、求和和合并

qq_51210361的博客

12-02

1903

在本篇文章中，我们将学习如何使用 DataFrame 对数据进行分组、合并和统计操作。这是一个非常实用的功能，特别适合处理大数据集。

agg函数对多列进行sum操作

最新发布

10-14

<think>我们想要对多个列进行求和操作，可以使用agg函数，并传入一个字典，键为列名，值为'aggregate function'，例如'sum' 或者也可以使用列表形式，对多个列应用相同的聚合函数下面给出两种方式的例子 </think># Pandas中使用agg函数对多列进行求和操作详解在Pandas中，`agg()`函数（全称aggregate）是进行数据聚合的强大工具，特别适合对多个列应用不同的聚合函数。以下是详细的解决方案： ## 基本用法：对多列应用相同聚合函数 ```python import pandas as pd import numpy as np # 创建示例数据 data = { 'Region': ['North', 'South', 'North', 'South', 'North', 'South'], 'Product': ['A', 'A', 'B', 'B', 'A', 'B'], 'Sales': [100, 200, 150, 250, 300, 400], 'Cost': [70, 150, 100, 200, 250, 300], 'Profit': [30, 50, 50, 50, 50, 100] } df = pd.DataFrame(data) # 按Region分组，同时对Sales和Cost列应用sum聚合 result = df.groupby('Region').agg({ 'Sales': 'sum', 'Cost': 'sum' }) print("按区域汇总销售额和成本:\n", result) ``` 输出结果： ``` Sales Cost Region North 550 420 South 850 650 ``` ## 高级用法：对多列应用不同聚合函数 ```python # 按Region和Product分组，应用不同的聚合函数 result_complex = df.groupby(['Region', 'Product']).agg({ 'Sales': ['sum', 'mean', 'max'], # 对Sales计算总和、平均值和最大值 'Cost': 'sum', # 对Cost只计算总和 'Profit': ['min', 'max'] # 对Profit计算最小值和最大值 }) print("\n多级分组聚合结果:\n", result_complex) ``` 输出结果： ``` Sales Cost Profit sum mean max sum min max Region Product North A 400 200.000000 300 320 30 50 B 150 150.000000 150 100 50 50 South A 200 200.000000 200 150 50 50 B 650 325.000000 400 500 50 100 ``` ## 使用自定义函数进行聚合 ```python # 定义自定义聚合函数 def profit_margin(series): """计算利润率：(总销售额 - 总成本) / 总销售额""" return (series['Sales'].sum() - series['Cost'].sum()) / series['Sales'].sum() def range_calc(series): """计算范围：最大值 - 最小值""" return series.max() - series.min() # 应用自定义聚合函数 custom_result = df.groupby('Region').agg({ 'Sales': ['sum', 'size'], # 标准聚合函数 'Profit': [('profit_range', range_calc)], # 自定义聚合函数 'Region': [('profit_margin', profit_margin)] # 使用多列数据计算 }) print("\n使用自定义聚合函数的结果:\n", custom_result) ``` 输出结果： ``` Sales Profit Region sum size profit_range profit_margin Region North 550 3 20 0.236364 South 850 3 50 0.235294 ``` ## 参数解释：agg()函数详解 `agg()`函数的关键参数和使用方式： 1. **func参数**： - 单个函数名或函数对象：`'sum'`、`'mean'`、`np.std`等 - 函数列表：`['sum', 'mean']`对所有列应用相同函数集合 - 字典：`{'列名': '函数'}`或`{'列名': ['函数1', '函数2']}` - 元组列表：`[('新列名', 函数)]`用于自定义结果列名 2. **常用聚合函数**： - `'sum'`：求和 - `'mean'`：平均值 - `'min'`/`'max'`：最小值/最大值 - `'std'`：标准差 - `'count'`：计数 - `'first'`/`'last'`：第一个/最后一个值 3. **特殊用法**： ```python # 对同一列应用多个聚合函数 result = df.groupby('Region').agg( total_sales=('Sales', 'sum'), avg_profit=('Profit', 'mean'), cost_range=('Cost', lambda x: x.max() - x.min()) ) ``` ## 处理多级列索引的结果当使用多个聚合函数时，结果会生成多级列索引： ```python # 处理多级列索引 multi_col_result = df.groupby(['Region']).agg({ 'Sales': ['sum', 'mean'], 'Profit': ['min', 'max', 'median'] }) # 方法1：重命名列 multi_col_result.columns = ['_'.join(col).strip() for col in multi_col_result.columns.values] print("\n扁平化列名:\n", multi_col_result) # 方法2：直接访问特定聚合结果 print("\n各地区平均销售额:", multi_col_result[('Sales', 'mean')]) ``` 输出结果： ``` 扁平化列名: Sales_sum Sales_mean Profit_min Profit_max Profit_median Region North 550 183.333333 30 50 50.0 South 850 283.333333 50 100 50.0 各地区平均销售额: Region North 183.333333 South 283.333333 Name: (Sales, mean), dtype: float64 ``` ## 最佳实践建议 1. **性能优化**： ```python # 对于大型数据集，使用内建函数比自定义函数更快 # 不推荐（慢）： df.groupby('Region').agg({'Sales': lambda x: x.sum()}) # 推荐（快）： df.groupby('Region').agg({'Sales': 'sum'}) ``` 2. **使用as_index参数**： ```python # 将分组键作为普通列保留 result = df.groupby('Region', as_index=False).agg({ 'Sales': 'sum', 'Cost': 'mean' }) ``` 3. **命名聚合（Pandas 0.25+）**： ```python # 更清晰的聚合语法 result = df.groupby('Region').agg( total_sales=pd.NamedAgg(column='Sales', aggfunc='sum'), avg_profit=pd.NamedAgg(column='Profit', aggfunc='mean'), max_cost=pd.NamedAgg(column='Cost', aggfunc='max') ) ```