【python】【DataFrame】如何先分组(groupby)再计算列均值

df_grouped = df.groupby(‘Month_of_Year’)[‘CallsPresented’].mean()

### 使用 `pandas` 进行分组计算均值 为了在 Python 中使用 `pandas` 库对数据进行分组计算均值,可以按照如下方式操作: #### 创建示例 DataFrame创建一个简单的 DataFrame 来展示如何执行此操作。 ```python import pandas as pd import numpy as np data = { 'Name': ['John', 'Helen', 'Sona', 'Ella'], 'Score': [82, 98, 91, 87], 'Option_Course': ['C#', 'Python', 'Java', 'C'] } df = pd.DataFrame(data) print("原始数据:") print(df) ``` #### 执行 GroupBy计算均值 接下来定义要基于哪个来进行分组,并调用 `.mean()` 方法来获取每组的平均分数。 ```python grouped_mean = df.groupby('Option_Course')['Score'].mean() print("\n按选修课程分组后的成绩均值:") print(grouped_mean) ``` 这段代码会依据 `'Option_Course'` 中的不同类别将数据分成若干子集,再针对每个子集中对应的 `'Score'` 值计算其算术平均数[^1]。 如果希望保留原表结构的同时增加一表示各组内的平均得分,则可采用 transform 函数: ```python df['Average_Score'] = df.groupby('Option_Course')['Score'].transform('mean') print("\n带有新增平均分的数据框:") print(df) ``` 对于含有缺失值的情况,在应用 `groupby().mean()` 或者其他聚合函数之前应该考虑处理这些 NaN 值。可以通过设置参数 skipna=True (默认行为),使得忽略掉任何包含NaN 的记录;也可以利用 fillna() 方法预填补它们[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值